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ADN POLYMERASE THERMOSTABLE ET INTEINES DE L'ESPECE 
THERMOCOCCUS FUMICOLANS 

La presente invention concerne une nouvelle ADN 
polymerase thermostable ainsi que ses deux inteines, 
provenant d'une archaebacterie de l'espece Thermococcus 
fumicolans . 

Les ADN polymerases sont des enzymes impliquees 
dans la replication et la reparation de 1 1 ADN dans toute 
cellule vivante. On connait aujourd'hui de nombreuses ADN 
polymerases isolees de micro-organismes tel que E. coli 
(ADN polymerase I) ou du phage T4 . Des ADN polymerases 
ont aussi ete identifiees et purifiees et a partir de 
micro-organismes thermophiles comme Thermus aquaticus 
(Taq polymerase, Chien, A. et al. J. Bact. 1976, 
127:1550-1557 ; Kaladin et al. Biokhymiya 1980, 45:644- 
651), Thermus thermophilics, ou encore des especes du 
genre Bacillus (demande de brevet Europeen publiee sous 
le No. 699 760), Thermococcus (demande de brevet Europeen 
No. 455 430), Sulfolobus et Pyrococcus (demande de brevet 
Europeen publiee sous le No. 547 3 59) . Parmi ces ADN 
polymerases issues d' archaebacteries on peut citer la 
Pfu, isolees de Pyrococcus furiosus (18), la Vent™ 
\ polymerase de Thermococcus litoralis (10), la 9°N de 
Pyrococcus sp. 9°N (15) et la DeepVent™ de Pyrococcus GB- 
D, les deux premieres provenant de souches du littoral 
(Baie de Naples) , les deux suivantes de souches sous- 
marines prof ondes . 

Le mecanisme d 4 action des ADN polymerases est 
aujourd'hui relativement bien connu et consiste en une 
replication de 1 'ADN a I'identique selon un mode semi- 
conservatif. Le brin recopie sert de matrice et les 
quatre nucleotides triphosphates sont le substrat de 
cette polymerisation. Les enzymes ayant une activite ADN 
polymerase sont aujourd § hui de plus en plus utilisees in 
vitro afin de travailler en biologie mol6culaire dans 
divers buts tels le clonage, la detection d'erreurs, le 
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s£quengage, . le marquage, et de fagon generale, 
1' amplification de sequences d'acides nucleiques. 

Cette amplification, in vitro, de sequences 
d'acide desoxyribonucleique fait appel a la technique de 
5 la reaction de polymerisation en chaine (PCR) decrite 
dans les brevets Europeens No. 200 362 et 201 184. Le 
principe de cette technique est base sur la realisation 
de cycles successifs d' extension d' amorces mettant en 
oeuvre les quatre nucleotides triphosphates ainsi qu'une 

10 ADN polymerase et un ADN matrice a recopier. A chaque 
cycle, 1 1 enzyme double le nombre de brins d ' ADN 
disponibles et entre chaque cycle une thermodenaturation 
est necessaire afin d'ouvrir la double helice d' ADN pour 
le cycle suivant. Les temperatures utilisees pour cette 

15 etape de thermodenaturation ne sont pas compatibles avec 
la conservation de l'activite de la plupart des ADN 
polymerases connues, telle la Klenow. C'est ainsi que des 
nombreux efforts de recherche ont ete realises afin de 
trouver des enzymes supportant ces temperatures. 

20 Cependant, si les micro-organismes thermophiles 

sont aujourd'hui connus, il reste encore difficile 
d'obtenir ces enzymes thermostables avec des rendements 
de production suffisants. La biologie moleculaire et le 
genie genetique permettent de palier cet inconvenient. 

25 Ainsi, une fois repere dans le genome, le gene codant 
pour 1 1 ADN polymerase est clone, sequence puis redone 
dans un vecteur d' expression afin de produire la prot^ine 
dite alors recombinante, chez un h6te mesophile plus aise 
a cultiver tel E. coli ou S. cerevisiae. Cette methode 

30 d' expression chez E. coli a notamment ete decrite dans la 
demande de brevet internationale PCT publiee sous le No. 
W0 89/06691 pour produire 1 ' ADN polymerase de Thermus 
aquaticus. 

L * ADN polymerase de 1' invention provient d' une 
35 archaebacterie de I'esp^ce Thermococcus fumicolans. Outre 
ses proprietes thermostables la rendant particulierement 
efficace notamment dans une processus de PCR, cette ADN 
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polymerase est remarquable en ce qu'elle presente deux 
" introns proteiques", encore appeles "inteines" , au 
niveau de son polypeptide precurseur. 

La sequence nucleotidique de ses inteines est 
5 inseree dans celle de l'ADN polymerase, generalement au 
niveau de sites conserves impliques, apres traduction, 
dans les reactions catalytiques . Ces sequences sont 
transcrites et traduites en mime temps que celle de l'ADN 
polymerase et l'epissage autocatalytique des inteines 
10 produit alors trois enzymes: deux inteines et une ADN 
polymerase. 

On trouve de telles inteines egalement au sein 
d'autres molecules telles l'ATPase vacuolaire chez S. 
cerevisiae (4), GyrA chez Mycobacterium leprae (7), Rec A 

15 chez Mycobacterium tuberculosis (5, 6). Les inteines font 
partie pour leur majorite de la famille des endonucleases 
de type "homing endonucleases" puisqu'elles coupent l'ADN 
en un site reconnu, a l'endroit m£me ou leur sequence 
nucleotidique vient s'inserer. 

20 Le developpement des biotechnologies tant dans 

la recherche que dans les domaines de la medecine ou de 
1 'agro-alimentaire, necessite de disposer de divers types 
d 1 ADN polymerases susceptibles d'ameliorer 
quantitativement et qualitativement des techniques aussi 

25 di verses que le clonage, la detection, 1 ' amplification de 
I sequences d' ADN, La presente invention vise precisement a 
offrir une nouvelle ADN polymerase thermostable qui est 
issue d'une espece r^cemment d^crite: Thermococcus 
fumicolans (8). Get isolat a et6 isol6 a partir de 

30 fragments de cheminees pr^levees dans le bassin Nord- 
Fidgien lors de la campagne franco- japonnaise STARMER en 
1989. Cette espece, anaerobie stricte, presente une 
temperature optimale de croissance de 90°C, ce qui est 
relativement eleve pour un Thermococcus . Son pH optimum 

35 est de 8,8, et son taux de salinite de 20 g/1 a 40 g/1. 

L f invention a done pour objet une ADN 
polymerase purifi^e thermostable d 1 archaebacteries de 
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l'espece Thermococcus fumicolans ayant un poids 
moleculaire de I'ordre de 89000 Da ainsi que ses inteines 
thermostables, dont le gene comportant les deux sequences 
codant pour lesdites inteines a ete clone. 
5 Les travaux de recherche ayant permis 

d' identifier, de sequencer et d'etudier l'ADN polymerase 
de 1' invention ont ete realisee a partir de la souche 
Thermococcus < fumicolans ST557 deposee a la Collection de 
l'Institut Pasteur (CIP) sous le numero CIP 104680. Cette 
10 ADN polymerase sera denommee dans ce qui suit Tfu. Sa 
sequence de 774 acides amines est representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 
Un poids moleculaire de 89797 Da et un pi de 8.1 ont ete 
deduits de cette sequence. 

15 

L' invention concerne done l'ADN polymerase 
purifiee thermostable d ' archaebacteries de l'espece 
Thermococcus fumicolans ayant un poids moleculaire de 
I'ordre de 89 000 daltons ainsi que ses derives 

20 enzymatiquement equivalents. On entend par derives 
enzymatiquement equivalent, les polypeptides et proteines 
constitues par ou comprenant la sequence en acides amines 
representee dans la liste de sequences en annexe sous le 
numero SEQ ID NO; 2 des lors qu'ils presentent les 

25 proprietes de l'ADN polymerase de Thermococcus 
fumicolans. A ce titre 1' invention envisage plus 
particuli^rement une ADN polymerase dont la sequence en 
acides amines est representee dans la liste de sequence 
en annexe sous le numero SEQ ID N0:1 ou un fragment de 

30 celle-ci ou encore un assemblage de tels fragments, comme 
la sequence de 774 acides amines representee dans la 
liste de sequences en annexe sous le numero SEQ ID NO: 2. 

En effet, la presence de deux inteines I-Tfu-1 
et I-Tfu-2 dans la sequence numero SEQ ID NO:l, sont 

35 susceptibles de conduire lors de la preparation par 
synthese chimique ou par genie genet ique, a des sequences 
d'ADN polymerase de T. fumiculans tronquees dont les 
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20 



25 



30 



35 



.proprieties enzymatiques sont equivalente a celle de l'ADN 
polymerase de T. fumicolans purifiee. 

On entend aussi par derives, les sequences en 
,acides amines ci-dessus modifiees par' insertion et/ou 
deletion et/ou substitution d'un ou plusieurs 
aminoacides, pour autant que les proprietes de l'ADN 
polymerase de T. fumicolans qui en resultent ne *soient 
pas signif icativement modifiees. 

L ' invention concerne egalement une sequence 
i d ' ADN constitute par ou comprenant la sequence codant 
pour une ADN polymerase de 1* invention. 

La sequence d 1 ADN represents dans la liste de 
sequences en annexe sous le numero SED id NO: 1 
irepresente une telle sequence. L'ADN codant pour l'ADN 
15 polymerase de T. fumicolans et ses deux inteines est 
j constitute par le nucleotides 357 a 5028. Les nucleotides 
|1 a 356 correspondent a la region promotrice de ce gene. 
En consequence, 1 ■ invention a pour objet une sequence 
| d 1 ADN constitute par ou comprenant la sequence comprise 
;entre les nucleotides 357 a 5028 de la SED ID NO: 1, ou 
un fragment de celle-ci ou encore un assemblage de tels 
; fragments . 

1' invention se rapporte tout particulierement a 
; une sequence d 1 ADN constitute par ou comprenant les 
nucleotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
jla sequence d 1 ADN represents dans la liste de sequences 
en annexe sous le numero SED ID NO: 1. 

Cette sequence code pour l'ADN polymerase de T. 
| fumicolans dont la sequence de 774 acides amines est 
representee dans la liste de sequences en annexe sous le 
numero SED ID NO: 2. 

L 1 invention concerne aufeant l'ADN polymerase 
fisolees et purif iees de la souche Thermococcus fumicolans 
que l'ADN polymerase preparees par syn these chimique, par 
exemple par ligature de fragments polypeptidiques , ou 
encore par les methodes du genie genetique. 
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Dans le cadre de ces methodes du genie 
genetique, 1* invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
,qu'un procede de production ou d' expression dans un h6te 
5 cellulaire des ADN thermostables de 1' invention. 

Un proced6 de production d'une ADN polymerase 
conforme a 1* invention consiste: 

- a transferer une sequence d'acide nucleique 
codant pour 1 1 ADN polymerase ou un vecteur contenant 

10 ladite sequence dans un hote cellulaire, 

- a cultiver l'hote cellulaire obtenu a l'etape 
precedente dans des conditions permettant la production 
de l'ADN polymerase, 

- a isoler, par tous moyens appropries, ladite 
15 ADN polymerase. 

L'h6te cellulaire mis en oeuvre dans les 
procedes precedents peut etre choisi parmi les 
procaryotes ou les eucaryotes et notamment parmi les 
bacteries, les levures, les cellules de mammiferes, de 

20 plantes ou d'insectes. 

Le vecteur utilise est choisi en fonction de 
l'hote dans lequel il sera transfere. 

L 1 ADN polymerase thermostable de 1 ' invention 
est utile notamment dans les procddes d ' amplification 

25 'enzymatique de sequences d'acides nucleiques . En 
consequence, 1 ' invention a pour objet, de tels procedes 
mettant en oeuvre l'ADN polymerase thermostable decrite 
precedemment, ainsi que les kits d 1 amplification 
comprenant, outre les reactifs g£neralement utilises, une 

30 quantite adequate de cette ADN polymerase. 

L' invention a egalement pour objet une inteine 
purifiee thermostable d 1 archaebacteries de l'espece 
Thermococcus fumicolans. 
35 Comme indiqu^ precedemment, les inteines sont 

aussi definies comme des introns proteiques qui sont non 
pas ^pisses au niveau de l'ARN messager mais au niveau 
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d'une maturation proteique. Elles relevant done d'un seul 
gene traduit et transcrit en une seule etape, et 
constituent des sous produits de la maturation de la 
proteine codee par ce gene (Xu, M.G., Comb, D.G . , Paulus 
5 H., Noren C.J., Shao Y., Perler, F.,1994, Protein 
splicing : an analysis of the branched intermediate and 
its resolution by succinimidine formation. EMBO J . 13, 
5517-5522. ) 

Les inteines sont des endonucleases de 
10 restriction qui ont la propriete de couper l'ADN a 
1'endroit meme ou s'insere leur gene, et en consequence, 
elles peuvent etre considerees comme des sequences 
egoistes . 

Les inteines possedent dans leur sequence toute 
15 1 ' information necessaire a leur propre epissage 
puisqu' elles s'epissent dans E. coli . 

II est possible de distinguer quatre grandes 
etapes de maturation proteique : 

- Une premiere etape de formation d'un 
20 intermediaire lineaire qui possede une fonction ester. 

Cette reaction est dependante du pH et de 1 ' environnement 
local de cette liaison (nature des acides amines) . Ce 
principe est utilise dans les kits de clonage, 
d' expression ou de purification mettant en oeuvre des 
25 inteines, car un changement de 1 ' environnement provoque 
ou non un episssage. En effet, celui-ci serai t inhibe a 
pH 11 et active k pH 7,5. 

- Une deuxieme etape de transesterif ication 
qui permet de transformer 1 ' intermediaire precedent et de 

30 d^placer l'equilibre de la premiere etape. 

La troisieme etape consiste en une 
cyclisation de l'asparagine liberant l'int^ine. 

- La quatrieme etape est la stabilisation de la 
proteine mature et la formation d'une reelle liaison 

35 peptidique. 

II est done possible de construire des mutants 
thermosensibles permettant de bloquer 1' epissage 
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proteique aux temperatures d' expression (3 0°C) et de 
l'induire par chauffage. 

Cette possibility de controle de 1' epissage 
proteique par la temperature peut-etre utilisee dans des 
5 vecteurs de cloftage avec une sequence codant pour 
l'inteine et des sites de clonage autour. Si la proteine 
a doner et a exprimer est toxique pour l'hote, on peut 
la doner en deux fragments autour de la sequence 
d'inteine. Ainsi, globalement, le gene a doner est 

10 complet mais il est interrompu par la sequence de 
l'inteine. Lors de 1 ' expression, l'inteine se retrouve 
dans la proteine exprimee, la rendant ainsi inactive. II 
est alors possible par chauffage, a la fin de 
1' induction, de liberer l'inteine par epissage 

15 autocatalytique et ainsi retrouver la proteine clonee 
active. 

Les inteines permettent ainsi de realiser des 
purifications et sont utilises dans des kits selon le 
, principe decrit ci-apres. Certains residus autour de site 

20 d' epissage de l'inteine sont modifies. L' expression de la 
proteine recombinante est realisee a basse temperature 
pour bloquer un eventuel epissage trop precoce. En C- 
terminal de l'inteine est fixe un site ayant une forte 
af finite pour la chitine. Lors de 1' induction, la 

25 proteine clonee est exprimee ainsi que l'inteine et le 
site de fixation a la chitine. La purification est alors 
realisee avec la chitine, sur des colonnes d'affinite, 
qui retiennent la chitine et aussi l'inteine et la 
proteine clonee, le tout faisant partie de la mdme pre- 

30 proteine. On hydrolyse alors 1'extremite N-terminale de 
1 ' inteine avec du DTT ou du p-mercaptoethanol pour 
liberer la proteine clonee. 

Les inteines sont aussi des endonucleases de 
restrictions thermostables , qui ont pour site de 

35 reconnaissance 1'endroit meme ou s'insere leur gene dans 
la sequence u h6te" . Elles poss^dent une sequence 
nucl6ique repetee deux fois (LAGLIDADG) dans la proteine, 
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sequence plus ou moins conservee et qui correspond au 
site actif de reconnaissance et de coupure de l'ADN. Ces 
enzymes semblent aussi avoir besoin de Mg++ pour leur 
activite. 

II convient de remarquer que les deux inteines 
de 1' invention sont coexprimees dans E. coli et sont 
autoepissees . Ce qui signifie qu'elle n'ont pas de 
toxicite pour l'hote, a la difference de 1'une des 
inteines de Thermococcus litoralis (9), et en consequence 
leur utilisation dans des kits d' expression ou de 
purification est aisee. 

Une premiere sequence d'inteine selon 
,1' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID N0:3. Cette inteine, 
denommee I-Tfu-1, presente un poids moleculaire de 41 409 
Da et un pi de 9,13, deduits de la sequence de 360 acides 
amines de la sequence SEQ ID NO : 3 . 

Une seconde sequence d'inteine selon 
1 ' invention est representee dans la liste de sequences en 
annexe sous le numero SEQ ID NO:4. Cette inteine, 
denommee I-Tfu-2, presente un poids moleculaire de 44 765 
Da et pi de 9,6, deduits de la sequence de 3 89 acides 
amines de la sequence SEQ ID NO: 4. 

Comme rappele precedemment, les inteines 
thermostables de 1' invention sont utiles notamment dans 
les procedes de restriction d' acides nucleiques et dans 
la mise au point de vecteurs d'expression permettant de 
r^duire la toxicite de la proteine a exprimer en inserant 
1'une des deux sequences d' inteines dans la sequence de 
la proteine a exprimer. Ceci peut se faire sans 
manipulation de la sequence des inteines si le clonage 
s'effectue chez E . coli, les techniques d' expression 
utilisees ayant demontre leur inocuit<§ pour cet organisme 
h6te. En consequence, 1 1 invention a pour objet, de tels 
procedes mettant en oeuvre 1'une des deux ou les deux 
inteines thermostables decrites precedemment, ainsi que 
les kits d' expression ou de purification contenant 1'une 
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ou les deux sequences codant pour les dites int6ines 
thermos tables. 

L' invention concerne egalement une sequence 
d'ADN constitute par ou comprenant la sequence codant 
pour une inteine de 1' invention. 

Une sequence d'ADN codant pour 1 1 inteine I-Tfu- 

1 est comprise entre les nucleotides 1675 et 2754 dans la 
sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 
code pour 1' inteine dont la sequence en acides amines est 
representee dans la liste de sequences en annexe sous le 
numero SED ID NO : 3 . 

Une sequence d'ADN codant pour 1' inteine I-Tfu- 

2 est comprise entre les nucleotides 3157 et 4323 dans' la 
sequence SED ID NO: 1 en annexe. Cette sequence d'ADN 
code pour 1 ' inteine dont la sequence en acides amines est 
representee dans la liste de sequence en annexe sous le 
numero SED ID NO: 4 . 

L' invention concerne autant ces inteines 
20 thermostables isolees et purifiees de la souche 
Thermococcus fumicolans que des inteines preparees par 
synthese chimique, par exemple par ligature de fragments 
polypeptidiques , ou encore par les methodes du genie 
genetique. 

25 Dans le cadre de ces methodes du genie 

genetique, 1 • invention a aussi pour objet un vecteur 
comprenant une sequence d'ADN definie precedemment , ainsi 
qu' un precede de production ou d' expression dans un hote 
cellulaire des ADN codant pour les inteines de 

30 1' invention. De tels procedes sont identiques a ceux 
rapportes precedemment pour 1 * ADN polymerase de T. 
fumicolans . 

D'autres avantages et caract^ristiques de 
35 1' invention apparaitront a la lecture des exemples qui 
suivent, donnes a titre non limitatifs et concernant le 
clonage, 1 ' expression, la caracterisation et l'activite 
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de l'ADN thermostable de 1' invention, et se referant aux 
dessins annexes dans lesquels : 

- La figure 1 represente 1 ' hybridation ADN-ADN 
de l'ADN genomique de T. fumicolans digere par di verses 

5 enzymes de restriction et hybride avec les sondes 
GE23ClaI-HindIII et GE23XhoI-SalI . 

- La figure 2 represente la strategic de 
clonage, la structure du gene de l'ADN polymerase de T. 
fumiculans et les produits du gene. 

10 - La figure 3 represente les resultats de 

purification de la polymerase recombinante de T. 
fumicolans apr£s une colonne d'heparine sepharose, 
visualises par SDS-PAGE. 

- La figure 4 represente les resultats de 
15 purification de la polymerase recombinante de T. 

fumiculans apres une colonne Bleue HTrap n°2, visualise 
par SDS-PAGE. 

- La figure 5 represente les resultats de 
purification de la polymerase recombinante de T. 

20 fumicolans apres une colonne de phosphocellulose , 
visualises par SDS-PAGE. 

- La figure 6 represente les resultats de 
purification de la polymerase recombinante de T. 
fumicolans apres une colonne MonoQ, visualises par SDS- 

25 PAGE. 

- La figure 7 represente les resultats de PCR 
avec l'ADN polymerase de T. fumicolans avec les fractions 
d' exclusion de la colonne MonoQ. 

30 I- Materiel et methodes. 

1) Conditions de culture, olasmides et souches 

Utilisees. 

Les souches Thermococcus litoralis (DSM 5474 T ) 
35 et Pyrococcus furiosus {DSM 3638 T ) ont ete obtenues 
aupres de la collection du Deutsche Sammlung von 
Microorganismen (DSM) Braunschweig-Stocheim, Allemagne. 
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La souche Pyrococcus sp. GE 23 a ete isolee de cheminees 
de sources hydrothermales profondes et a ete fournie par 
G Erauso (CNRS, Station Biologique de Roscoff , France) . 
La souche Thermococcus fumicolans a ete obtenue aupres du 
5 laboratoire de Microbiologie Marine de G. Barbier 
(IFREMER-DRV-VP-CMM) a Brest, France. Cette souche, 
Thermococcus fumicolans a ete obtenue par purification a 
partir de fragments de cheminees hydrothermales 
receuillies dans le bassin nord-Fidgien lors de la 

10 campagne franco- japonaise STARMER effectuee en 1989 a 
2000 metres de profondeur. 

Pyrococcus sp.GE23 a ete cultivee a 85°C dans 
un milieu 2216S (DIFCO) a un pH de 6,5. 

Thermococcus fumicolans , decrite en 1996 

15 (Godfroy et al . ) est cultivee en conditions anaerobies 

dans un milieu contenant les elements suivants: peptone 
2g/l; extraits de levure 0,5g/l; sel de mer (Sigma) 
30g/l; tampon PIPES 6,05g/l, soufre elementaire 10g/l, 
rezasurine lmg/1. Le pH est ajuste a 8,5 par de la soude 

20 5N a 20°C. 

La souche de Escherichia coli SURE (Stratagene, 
La Jolla, Calif.) a ete cultivee dans du milieu LB avec 
le ou les antibiotiques appropries , a 37°C sous 
agitation. Cette souche a ete utilisee comme hote pour 

25 recevoir les constructions primaires a partir des 
vecteurs pUC 18 ou pBluescript. Les souches NovaBlue, 
BL2KDE3) et BL21 (DE3 ) pLysS (Novagen, Madison, Wi.) ont 
et6 cultivees dans du milieu 2xYT avec les antibiotiques 
appropries a 37°C ou 3 0°C. Ces souches ont ete utilisees 

30 commes hotes pour les plasmides d* expression. 

2) Isolement de l'ADN. hybri dation et ADN 
recombinants , 

L'ADN de haut poids moleculaire de Thermococcus 
35 fumicolans a ete isole par la methode de Charbonnier 
modifiee (3) . Les cellules ont ete resuspendues dans un 
tampon TE-Na IX, puis lysees a 40°C pendant trois heures 
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avec un melange de N-Lauryl-sarcosine 1%, dodecyl sulfate 
de sodium 1% et 0,4 mg/ml de proteinase K. Apres la lyse, 
une centrifugation a 5000g pendant 10 minutes permet 
d'eliminer les debris cellulaires. L'ADN est extrait par 
5 un traitement au Phenol-Chlorof orme-alcool Isoamylique ou 
PCI (25-24-1), puis traite par la RNAse a 5fxg/ml a 60°C 
pendant une heure . Ces etapes sont suivies de deux 
extractions additionelles par PCI et d'une extraction au 
chlorophorme . L'ADN est ensuite precipite a l'ethanol 

10 absolu a -20°C, puis centrifuge, seche a l'air et repris 
dans un tampon TE-lx. La concentration et la purete de 
cet ADN sont mesurees par spectrophotometrie a 230, 2 60 
et 280nm avec un appareil GeneQuantll (Pharmacia, 
Upsalla, Sweden) . Pour la construction de la mini-banque 

15 genomique en pUC 18 (17), 1 1 ADN a ete totalement digere 
pendant une nuit a 37°C par une serie d 1 enzymes de 
restriction (BamHI, Hindlll, EcoRI, EcoRV, Pvull, Sail, 
Xbal et Xhol) par simples et doubles digestions. Puis les. 
fragments d' ADN sont fractionnes sur gel d' agarose a 0,8% 

20 dans de TBE-1X et trans feres sous vide sur une membrane 

de nylon Hybond-N+ (Amersham, UK) . Ces membranes ont et6 

hybridees avec des sondes d 1 ADN preparees par PCR avec 

des amorces specifiques selectionnees a partir des genes 

d 1 ADN polymerases de P, furiosus , T. litoralis et 

25 Pyrococcus sp, GE23 . Ces sondes sont prealablement 

3 2 

marquees au P par "random priming" conformement aux 
recommandations du fabricant (Megaprime, Amersham, UK) . 
Deux sondes de P. furiosus ont ete utilisees, Pfu et Pfu 
F, couvrant respect ivement les regions delimitees par les 

30 paires de bases 8 a 2316 et 819 a 1915 de la section 
codante du gene de la polymerase comme def ini par Uemori 
et al- (18). Deux sondes de T. litoralis, Tli I et Tli T, 
couvrant respect ivement les regions delimitees par les 
paires de bases 297 a 1768 et 4631 a 5378, 

35 comme d£fini par Hodges et al . (9). Deux sondes de 
Pyrococcus sp GE23 ont ete utilisees, l'une contenant la 
partie 5' du g6ne (fragment Clal-Hindlll 
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correspondant aux sites pb 8 et pb 1353 de la section 
codante) et 1 ' autre contenant la partie terminale de ce 
meme gene obtenu par PCR (amorces dites d' expression Ndel 
et Sail correspondant aux sites pb -1 et pb 2318, puis 
5 digestion par Xhol et Sail comprenant les bases du n° 
1879 a 2318) . Les fragments positifs ont ete identifies 
par hybridation ADN-ADN (14). Seules les hybridations 
avec les sondes de Pyrococcus sp. GE 23 ont fourni des 
signaux positifs a 55°C en moins de 24 h d' exposition. 

10 Les sondes issues de T. litoralis et de P. furiosus n'ont 
donne aucun resultat, meme a 50°C dans un tampon standard 
sans f ormamide . A partir des hybridations avec les sondes 
de Pyrococcus sp. GE 23, des fragments Hindlll de 1,9 kb 
ont ete selectionnes , puis prepares par une digestion 

15 appropriee de lOOug d'ADN genomique, purifies dans des 
sacs de dialyse a partir des gels d' agarose, et 
precipites a l'ethanol absolu apres une extraction au 
PCI. Les fragments ont ete ligatures dans un pUC 
18/HindIII dephosphoryle . Les transformations des souches. 

20 hotes ont ete realisees par electroporation (Gene Pulser, 
Biorad) . Le criblage des clones recombinants a ete 
effectue par selection a 1 ' ampicilline , alpha- 
complementation sur substrat X-Gal-IPTG puis hybridation 
de colonies selon les techniques standards (12) . La 

25 temperature des hybridations de colonies etait de 55°C 
;avec les sondes de Pyrococcus sp GE23, dans un tampon 
standard sans f ormamide. L'ADN plasmidique a ete isole 
selon la methode decrite par Bimbo im et Doly (1), puis 
purifie par chromatographie echangeuse d' anions en phase 

30 solide (Quiagen, Chatsworth, Calif.). Les fragments de 
restriction des plasmides ont ete purifies sur gel 
d'agarose par la methode du GeneClean (Bio 101, La Jolla, 
Calif.) pour un clonage ulterieur. 

L'ARNr 16S et 23S de Thermococcus fumicolans a 

35 ete amplifie par PCR en utilisant les amorces suivantes : 

- amorce directe Aa: 5' TCCGGTTGATCCTGCCGGAA-3 1 

- amorce reverse 23Sa: 5 1 -CTTTCGGTCGCCCCTACT-3 1 
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- etape initiale 3 minutes a 94°C suivi de 30 
cycles (94°C, lmin/ 49°C, lmn/ 72°C, 2mn) et, elongation 
finale de 5 mn a 72°C. 

Le produit de PCR a ete clone dans le vecteur 
pUC18 pour sequenqage ulterieur. 

3) Seouencaae des Am 

Les sequences d'ADN ont ete obtenues par la 
methode de terminaison de chaine (13) en utilisant un 
systeme d' analyses automatique d'ADN Applied Biosystems. 
Les deux brins des genes codant pour l'ADN polymerase et 
les deux inteines ont ete sequences en utilisant des 
amorces universelles localisees sur des vecteurs ainsi 
que des amorces internes. 

La sequence d'ADNr 16S a ete realisee sur les 
deux brins, apres clonage (SureClone, Pharmacia, Uppsala, 
Sweeden) , en utilisant le kit Hot-Tub (Amersham, UK.) 
afin de lever les compressions. 

L' analyse de sequence a ete realisee avec le 
20 logiciel DNASTAR (Madison, Wis., USA) et le programme de 
Genetic Computer Group (University of Wisconsin 
Biotechnology Center, Wis., USA) accessible en ligne sur 
INFOBIOGEN. Les recherches inf ormatisees de similitude 
ont ete realisees avec le programme BLAST, les 
25 alignements multiples avec CLUSTAL V, et les arbres 
phylogenetiques ont ete etablis selon la methode dite de 
"Neighbour- joining" (11) . 
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4) Construction dn recombinan t exnrimant l'ADN 
polymerase de Ther mococcus fumicolanf; . 

L'ADN polymerase de Thermococcus fumicolans 
ainsi que ses deux inteines, ont ete exprimees en meme 
temps chez E. coli avec le vecteur d' expression PARHS2 
qui appartient a la famille des systemes d' expression T7 
35 (16) acquis aupres d ' Eurogentec . 

La PCR a ete utilisee pour preparer le fragment 
complet de l'ADN polymerase et des deux inteines en 
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utilisant des amorces contenant les sites de restriction 
Ndel et BamHI : 

- amorce Tfu Dir : 
5'-TGG GGA TCC ATA TGA TCC TCG ATA CAG ACT ACA TC-3 ' 
5 - amorce Tfu Rev : 

5 ' -AAG CTT GGA TCC TCA TTT CTT CCC CAT TTT GAG CC-3 1 

Le melange reactionnel contenait 1 1 ADN 
polymerase GOLDSTAR (Eurogentec, B) , 1 • enzyme Tag 
Extender (contenant la Pfu de Stratagene) , le tampon 

10 d' extension avec les quatre dNTP (chacun a 0,2mM) et les 
amorces Tfu Dir et Tfu Rev a 50 pmoles dans un volume de 
50ul final. L * amplification a ete effectuee sur 20 cycles 
: 1 mn 94°C, 1 mn a 54°C et 6 mn a 72°C en utilisant un 
thermocycleur Stratagene 96-gradient. Les fragments de 

15 PCR ont ensuite ete digeres par les enzymes Ndel et BamHI 
puis ligatures aux memes sites du vecteur, retablissant 
ainsi le codon d ' initiation . La construction ainsi 
obtenue a ete nominee PARHS2TFU1. Cette construction a ete 
sequencee aux sites de jonction afin de verifier son 

20 integrite par rapport a la sequence de 1 'ADN genomique. 

Les tests d' expression ont ete realises selon le 
protocole suivant: selection des clones recombinants dans 
la souche E. coli Novablue, expression avec la souche 
BL21(DE3)pLysS dans un milieu 2xYT et induction de quatre 

25 heures a ImM d'IPTG. 

Les premiers essais d' induction ont ete 
realises sur des cultures de 5 ml, induites ou non. Des 
precultures de nuit sont realisees sans inducteur et 
relancees dans un milieu frais le matin (au dizieme) , 

30 jusqu'a ce que la densite optique (mesuree a 600nm) soit 
de 0,6, puis soit induites pendant 4 heures, soit non 
induites et arr£tees au bout de 2, 4 ou 14 heures. Quatre 
ml de cultures sont alors centrifuges a 4°C, SOOOrpm 
pendant 10 minutes. Le culot est ensuite repris dans un 

35 tampon de lyse (Tris-HCl lOmM pH 7,5; NaCl lOmM, MgCl2 2 
mM) . Les cellules ainsi reprises sont alors lysees, soit 
avec du triton X-100 1% v/v, soit du lysozyme a Img/ml de 
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lyse et laissees sur glace environ 5 a 10 min. Les 
cellules sont ensuite thermodenaturees par une exposition 
de 2 0 min a 72 °C. Ceci, permet de detruire en grande 
partie les cellules de l'hote mesophile sans detruire les 
5 proteines recombinantes . Le produit de lyse est ensuite 
centrifuge 20 min a 10 OOOrpm a 4°C. Le surnageant est 
recupere afin de le tester en incorporation, en PCR ou 
sur gel . Les incorporations sont realisees suivant deux 
techniques : 

10 - Avec de la thymidine tritiee comme traceur. 

L' incorporation est realisee sur du thymus de veau active 
; (SIGMA Aldrich, F.) dans le milieu de reaction suivant: 
Tris-HCl 50mM pH 8,8 ; DTT ImM ; MgCl2 10mM ; KC1 lOmM ; 
BSA 0,4 mg/ml; chaque dNTP a 0,4 mM. 

15 - Avec du 32 P -dATP (Amersham) comme traceur. 

L' incorporation est realisee sur de 1 ' ADN thymus de veau 
active (Appligene) dans le milieu de reaction suivant: 
Tris-HCl pH 9 50mM; KC1 50mM; MgCl2 7mM; BSA 0 , 2mg/ml et 
(NH4+)S04 (filtre) 16mM, avec un melange des 4 dNTP a 

20 500uM final chacun. Cette seconde methode permet 
d'es timer avec precision le nombre d' unites d' enzyme. 

5) Purification. 

25 a) Culture. 

Apres des essais en petits volumes, les 
cultures destinees a 1' expression de 1' enzyme 
recombinante ont et£ realisees comme suit: production 
d'un inoculum de 700 ml (milieu 2x YT complements en 

30 ampicilline et chloramphenicol) cultive a 30°C jusqu'a 
DO = 0,8; ensemencement d'un fermenteur contenant 16 1 du 
meme milieu; culture pendant 4 h jusqu'A DO= 0,6, puis 
induction a l'IPTG 1 mM et culture pendant 4 h. La 
biomasse resultante est centrifugee 20 mn a 6 000 rpm a 

35 4°C (Centrifugeuse JOUAN) . 
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b) L0£££ — geiUulfrljre — et premiere etape de 

20 g de biomasse sont repris dans 80 ml de 
tampon (20 mM Tris-Cl pH 7,5; 10 mM NaCl? 2 mM MgC12 ; 1 
mM EGTA ; 1% Triton xlOO; 2,2 mM PMSF) . Le melange 
resultant, maintenu a 4°C maximum, est sonique a 12 
reprises successives (cycle de 15 s) jusqu'a obtention 
d'une solution liquide. Le surnageant est ensuite 
centrifuge 20 mn a 4°C h 20 000 rpm (SORVALL Ti45) . Le 
surnageant est recupere et traite par la chaleur (70°C 
i pendant 10 mn) afin de thermodenaturer 1'essentiel des 
proteines natives de E. coli, puis centrifuge a nouveau. 

c ) Chromatographie . 

Les 70 ml de surnageant issus de l'etape 
; precedente sont charges sur une colonne Pharmacia 
Heparine Sepharose (30 ml de resine), apres equilibration 
avec un tampon A (10 mM Tris-Cl pH 7,5; 0,5 mM EGTA; 5 mM 
: MgCl2; 10 mM fl-mercaptoethanol ; 0,2% Triton xlOO et 10% 
glycerol. Un lavage est effectue avec un tampon B (idem 
tampon A + 2 M NaCl) k raison de 0,3 ml/mn sur un systeme 
FPLC Pharmacia. Les differentes fractions sont recuperees 
en gradient de NaCl. 

Les fractions actives ainsi recuperees sont 
dialysees pendant 5 h centre un tampon C: 10 mM Tris-Cl 
pH 7,5; 0,5 mM EGTA; 5 mM MgC12; 10 mM -mercapto£thanol ; 
0,2% Triton xlOO; 10% glycerol; 50 mM NaCl. Les produits 
issus de dialyse sont success ivement charges sur une 
colonne d'af finite pour les proteines se liant k 1'ADN 
(Pharmacia, Bleue HiTrap) et elues en gradient de NaCl 
avec les memes tampons que prec^demment . 

30ml de fractions actives obtenues precedemment 
sont chargees sur une colonne de phosphocellulose avec de 
la resine Pll de Whatmann ( volume :20ml; diametre: 
2,5cm). Ces fractions ont <§te dialysees 5 heures contre 
le tampon suivant : KP04 pH7 20mM, EDTA 0,lmM, DTT ImM, 
Glycerol 5%, Triton X-100 0,1% et KC1 0,1M. Le debit de 
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la colonne est regie a 0,2ml/min, le tampon A de 
chargement est compose de KP04 pH7 20mM, EDTA 0,lmM, DTT 
ImM, Glycerol 5%, Triton X-100 0,1% et le gradient (entre 
0% et 50% deB) est realise par le KC1 present dans tampon 
B a 2M. 

Ayant deja mis en evidence que cette polymerase 
ne se fixe pas sur une MonoQ ou une ressource Q et ce, 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en faisant l'hypothese d'une 
fixation de l'ADN contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
de la deuxieme Bleue HiTrap avec un aliquot de 5ml et 
dialyse selon la meme methode que pour un passage sur une 
Bleue HiTrap. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
plus actives 45, 46 et 49. Les fractions sont tout 
d'abord chauffees 40 min a 85°C. Une premiere dialyse est 
alors realisee contre le tampon KC1 0,lmM, K2HP04 1M 
pH7,5 pendant 3 heures . La deuxieme dialyse est realisee 
avec le tampon suivant : K 2 HP04 pH 7,5 lOmM, K 2 P04 lOmM, 
KC1 25mM, DTT ImM, Triton X-100 0,1%, Glycerol 10%, 
pendant 1 heure. La solution est alors chargee sur une 
colonne MonoQ a 0.5ml /min avec un gradient en NaCl de 0 a 
25 20% (tampons utilises pour l'Heparine) . 

6 >" Activites exonupl^^irpmc 

Les tests d' exonuclease 3 '-5' sont quantifies 
par la liberation de nucleotides marques au 32 P 

30 A cette fin, une premiere etape permet de 

realiser le marquage: l'ADN de est digere par HindHI 
puis, le fragment de Klenow recopie l'ADN a partir des 
extremites 3 ' -OH libres , dans un milieu contenant outre 
le tampon, l'ADN et 1' enzyme, du 32 P dATP et du 32 P dTTP, 

35 les dGTPet dCTP etant froids. Apres une heure a 37°C, les 
quatre dNTP froids sont rajoutes en exces pour une demi- 
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heure. La Klenow et. les. dNTP .sont elimines.-- pax une 
extraction au phenol et precipites a 1'ethanol. 

Les tests exonucleasiques sont effectues dans 
des solutions contenant les tampons des enzymes, 
5 0,02mg/ml d'ADN marque, et incubees toute la nuit a 72°C, 
80°C et 95°C. Differents tampons contenant du MgCl2 ou du 
MnS04 sont testes. Le meme test est realise avec la Vent 
en temoin positif . 101 de solution de reaction sont alors 
deposes sur papier DE81 (Watmann) , seches puis comptes 
10 avant et apres lavage (3 fois 5 min avec du Na2HP04, 1 
fois a l'eau puis a 1'ethanol a 95%) en utilisant la 
technique de Cerenkov. 

Pour le test d'actvite exonucleasique 5'-3', la 
reaction de marquage utilise la polynucleotide kinase 
15 afin de marquer le substrat en 5'. 

II - fiesultats. 

1) Isolement du gene de l'ADN polymerase ^ 
20 Thermococciis fuwjcoXam? ajjiai que des deux gen^s 

L'ADN de Thermococcus fumicolans, digere par 
une serie d' enzymes de restriction, a ete hybride a des 
sondes de P. furiosus et T. litoralis, preparees par PCR 

25 et aux sondes de Pyrococcus sp. GE23 obtenues lors du 
clonage de cette autre ADN polymerase {D6p6t de brevet 
n°96 08631 aupres de l'INPI). Comme montre dans les 
figures la et lb, 1' hybridation de type Southern blot a 
revele des fragments de deux types : un fragment Hindlll- 

30 Hindi II de 1,9 kb et un fragment Xhol-Xhol de 5 kb. Ces 

deux fragments ont ete reveles uniquement avec la sonde 

Clal-Hindlll du gene de Pyrococcus sp. GE23, marquee au 
3 2.. 

P avec une exposition de deux heures . Les deux 
fragments reperes ont ensuite ete recuperes et purifies 
35 comme decrit precedemment dans Materiel et Methodes puis 
clones dans le vecteur pUC18 dephosphoryle et digere par 
Hindlll ou dans le vecteur pBluescript dephosphoryle et 
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digere par Xhol . Environ 400 recombinants (E. Coli SURE) 
ont ete cribles avec la sonde Clal-Hindlll . Sur ces 400 
colonies, deux ont donne un signal positif lors de 
1' hybridation. (n° 9.26 et 12.79). Les deux clones ont 
et<§ mis en culture en milieu LB -Amp et leurs profils de 
restriction etaient identiques, avec tin insert de 1,8 kb. 
iLe sequence ulterieur de l'un de ces clones (designe 
557MACa) et la comparaison de sequence (Megalign, 
programme DNASTAR) ont montre qu'il correspond a la 
region promotrice et aux 1404 premieres paires de base 
d'un gene d'une ADN polymerase appar tenant a la famille B 
(2) . 

En ce qui concerne le fragment Xhol-Xhol de 
5 kb, 700 recombinants ont ete cribles sans aucun signal 
positif lors de 1 'hybridation. Cette absence de reussite 
pourrait etre due a la presence d'une inteine au sein de 
ce fragment, le rendant alors instable dans un vecteur a 
haut nombre de copies de type pBluescript. 

Apres 12 heures d' exposition, un deuxieme 
fragment Hindlll-Hindlll de 2 kb a ete repere par 
hybridation de type Southern sur la meme membrane que 
precedemment, en utilisant comme sonde marquee la fin du 
gene de Pyrococcus sp. GE23 entre les sites Xhol et Sail 
(fragment obtenu par digestion de produit de PCR) . Ce 
fragment a ete clone comme precedemment. Environ 200 
clones recombinants ont ete cribles et quatre d' entre eux 
ont donn6~un signal positif. Les quatres clones ont un 
profil identique apres digestion par 1 ' enzyme de 
restriction Hindlll. L'un d'entre eux, 557MACc, a <ste 
sequence et la comparaison de sequence a demontre qu'il 
s'agissait de la fin du gene de l'ADN polymerase 
precedemment identifiee. 

Supposant que les fragments de genes obtenus 
appar tenaient a la meme ADN polymerase, des 
oligonucleotides ont 6te utilises afin d'amplifier la 
zone manquante. Ce fragment de PCR a ensuite ete purifie 
sur gel comme decrit dans Materiel et Methodes, et 
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utilise comme sonde marquee radioactivement pour reperer 
sur la membrane le fragment manquant. Apres deux heures 
de revelation un fragment Hindlll-Hindlll a ete revele, 
de 2 kb environ. Clone comme precedemment , 600 colonies 
ont alors ete criblees, dormant quatre clones positifs. 
Les quatre clones avaient le meme profil et l'un d'entre 
eux, nomme 557MACb a ete sequence et les comparisons de 
sequences ont demontre qu'il s'agit de la partie 
intermediate de l'ADN polymerase et ce fragment, 
delimite par deux sites Hindlll, s'insere parfaitement 
entre 557MACa et 557MACc. L ' ensemble de ces trois clones 
donne la sequence complete de l'ADN polymerase de T. 
fumlcolans. 



2) Position phvlnrrpnetioufi d e m^mom^nc 

fumicolan^ 

Thermococcus fumicolans est une nouvelle espece 
de Thermococcales decrite par Godfroy et al (8) . 

3 > Sequences nucleoli rtiouaa pi- polvnpnUHirp.oc 
de l'ADN polymerase de The ^ ococcus fimiicolan^ 

a) Sequences nuclpo tidiaues 

Les trois fragments delimites par des sites 
Hindlll ont ete assembles (figures 2 et 3). lis forment a 
eux trois un fragment de 5039 paires de bases. Le premier 
fragment, "issu du clone 557MACa, contient le codon de 
depart ATG en position 457 pb. La phase ouverte de 
lecture est alors ininterrompue sur 4572 paires de bases 
jusqu'a rencontrer un codon STOP sur le fragment issu du 
clone 557MACC en position 5028 pb, six paires de bases 
avant le dernier site Hindlll. Par alignement, avec les 
autres genes d'ADN polymerases disponibles en banques 
(Pfu, Tli, GB-D, KOD, ..), avec la methode CLUSTAL V, 
completee par un alignement manuel final necessaire pour 
restituer les sites d' autoepissage des inteines, deux 
sequences d' insertions ont ete mises en evidence. 
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- La premiere est inseree a la paire de base n° 
1675 et se termine a 2754, etant ainsi repartie entre le 
fragment issu du clone 557MACa et celui du clone 557MACb. 

- La deuxieme est inseree a la base n° 3157 et 
se termine a 4323. Elle est, de meme, repartie entre le 
clone 557MACb et 557MACC. 

Ces deux sequences d' insertions forment, avec 
le reste de la sequence codant pour l'ADN polymerase, un 
seul cadre de lecture. 

fa ) Sequences polvn eptidioues . 

La section codante du gene de l'ADN 
polymerase est done constitute de trois parties 
disjointes. La premiere partie du gene, portee par 
557MACa, comporte la zone codant pour 1 ' exonuclease 3'- 
5', ou apres traduction, on reconnait le motif FDIET. La 
deuxieme partie, portee par 557MACb et la troisieme 
partie portee par 557MACc comprennent les sites conserves 
; SLYPSI, et YG.DTD. 

Les deux sequences d' insertion sont situees 
sur des zones conservees de l'ADN polymerase, la premiere 
au site DFR/ SLYPSI I comme I-KOD-1 de Pyrococcus sp. KOD1 
et la deuxieme au site D/TDG comme I-Tli-1 de T. 
litoralxs. Ces deux proteines sont liberees par 
autoepissage proteique. Elles comportent les sites de 
type LAGLIDADG repetes deux fois a 100 paires de bases de 
distance "environ. Les alignements avec les autres 
!inteines deposees dans les banques de sequences 
permettent de les assimiler a des endonucleases de 
restriction de type archaebacterien, endonucleases qui 
coupent l'ADN a l'endroit precis ou leur gene s'insere. 



c) Cpmparaison avec les autres sci e nces rl'Arw 
polymerases 

35 L'alignement des differences sequences 

polypeptidiques des ADN polymerases de Thermococcales 
disponibles en banque, p. abyssi strain GE5 , Pyrococcus 
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1 sp. GE23, Pyrococcus sp. KOD1, Pyrococcus sp. GB-D, P. 
! furiosus, Pyrococcus sp 9°N, T. litoralis avec la 
sequence de T. funiicolans (sans inteines) , realise avec 
le programme CLUSTAL utilisant la matrice PAM250, donne 
5 | les niveaux de similarite entre ces diverses polymerases 
figurant au tableau 1 ci-dessous. 

Tableau 1 



Espece 


1 


2 


3 


4 


5 


6 


7 


8 


1 - T. fumicolans 


XXX 


81,7 


89,3 


77,6 


77, 3 


80,0 


79,3 


90,6 


2 - P. sp. GB-D 




XXX 


81/3 


85,1 


76,9 


89,0 


88,1 


82,6 


3 - P. sp. K0D1 






XXX 


78,8 


77,5 


80,7 


79,9 


90,3 


4 - P. furiosus 








XXX 


73,9 


83,3 


82,5 


79,6 


5 - T. litoralis 










XXX 


75,9 


75,0 


76,5 


6 - P. sp. GE23 












XXX 


98,7 


80,9 


7 - P. abyss i 














XXX 


-80,2 


8 - P. sp. 9°N 
















XXX 



Le niveau de similarite le plus proche est 



10 celui observe avec Pyrococcus sp. 9°N (90,6%), ce qui 
! indique clairement que l'ADN polymerase de T. fumicolans 
est originale au niveau de sa sequence et constitue de ce 
fait une nouvelle ADN polymerase. 

i 

15 d) Cpmparaison des inteines avec les autr^c, 

j inteines disoonibles dans le s banaues . 

Les sequences disponibles en banque ont ete 
' alignees selon les memes methodes que precedemment . Les 
comparaisons de 1 ' ensemble des inteines demontrent que 
20 celles-ci sont reparties en trois groupes correspondant 
; aux sites d'insertion des motifs A (R/SLYPSI) , B 
(KILAN/S) et C (D/TDG) . L'analyse des niveaux de 
similarite et la recherche de relations phylogenetiques 
; n'ont de sens que pour des inteines appartenant a la meme 
25 classe, c'est a dire s'inserant dans un motif donne. Les 
i niveaux de similarites pour I-Tfu-1 (classe A) et I-Tfu-2 
1 (classe C) avec leurs inteines homologues deja decrites 
sont donnes respectivement aux tableaux 2 et 3 ci- 
dessous. 

30 Tableau 2 
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1 


2 


3 


1 


I-Tfu-1 


XXX 


41,4 


75,3 


2 


I-Mia-1 




XXX 


51,7 


3 


I-KOD-1 






XXX 



Tableau 3 







1 


2 


1 1 


I-Tfu-1 


XXX 


62,2 i 


2 


I-I-Tfli-2 




XXX 



I-Tfu-1 et l-Tfu-2 semblent representer deux 
nouveaux "alleles" des "homing" endonucleases 
archaebacteriennes des classes A et C. 

I-Tfu-1 est le troisieme allele connu d'inteine 
s'inserant au site A des ADN polymerase d'Archaea, tandis 
que I-Tfu-2 est le second de sa classe. 

5) Expression, cararterisaH o n et. a^Hyj^ fl g 
I 'ADN polymerase de T. fiimi^i^* 

a > Clonaae et s^r^f^on 

Un insert de 4595 pb obtenu par PCR longue- 
distance avec les amorces TfuDir et TfuRev et couvrant la 
totalite du gene de 1 'ADN polymerase de Thermococcus 
fvmicolans, avec les deux inteines, a ete clone aux sites 
Ndel et BamHI d'un vecteur pour transformer la souche E. 
coli Novablue. Des mini-preparations d' ADN plasmidique 
ont ete realisees sur une dizaine de clones trans formants 
et ont toutes donne un signal positif a 1' hybridation. 
Deux clones ont ete retenus sur la base de leur profil 
apres une digestion par Ndel et Sail ou par Hindlll. Ces 
deux plasmides ont ensuite ete transformes dans la souche 
E. coli BL21(DE3)pLysS. 

Des essais d' expression ont ete realises en 
culture de 5 ml afin de determiner les conditions 
optimales de culture et d' induction. Tout d'abord les 
essais de cultures ont ete realises a 37°C, ou l'on 
observe une lyse cellulaire trop importante, puis a 30°C 
ou la culture ne lyse pratiquement pas. La culture est 
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realisee en milieu 2xYT, oil le rendement de production 
est meilleur et la lyse reduite, supplements avec de 
l'ampicilline (100ng/ml) et du chloramphenicol (15ng/ml) . 
L' expression est alors induite en phase exponentielle de 
croissance (DO600nm = 0,6 a 0,7) avec une concentration 
en IPTG de ImM, concentration qui s'est averee optimale. 
Des echanti lions soht preleves avant induction puis 2 
heures, 4 heures et 6 heures apres induction, ainsi 
qu' apres une nuit. Des prelevemments sont aussi realises 
sur les cultures non induites apres 6, 8, 12 et 24 heures 
de culture. 

Les echantillons sont alors traites comme 
indique au chapitre Materiel et Methodes, afin de tester 
le niveau d' activite de 1 'ADN polymerase recombinante par 
incorporation de thymidine tritiee ou de 32 P dCTP. Cette 
premiere technique, qui permet une approche qualitative, 
nous donne deux types de comportement . Un des clones est 
non inductible et la meilleure activite est obtenue apres 
une nuit de culture (clone rTful-1) . Un second clone est 
inductible et presente une activite maximale apres quatre 
heures d' induction, activite qui diminue par la suite 
(clone rTfulOO-2). Deux autres clones, aussi testes sont 
faiblement inductibles et expriment tres peu l'ADN 
| polymerase . 

Les clones rTful-1 et rTfulOO-2 sont ensuite 
testes en erlenmeyer de 50 ml dans les conditions 
decrites ptecedemment . Seul le clone inductible rTfulOO-2 
a une expression constante en volume de 50 ml. La suite 
des travaux a done ete realisee sur ce clone . 

b) Fermentation e xtract. i on des r-P>n,n og 
La culture du clone Tful00-2 a ete realisee 
dans un fermenteur de 16 litres, dans le milieu 2xYT 
supplement^ en ampicilline et chloramphenicol. La 
preculture, de 750ml a ete realisee la veille et arretee 
en phase exponentielle (DO 600nm= 0,7-0,8) et laissee a 
4°C pour la nuit. Le fermenteur a ete prepare et mis en 
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temperature a 30°C avec le milieu de culture. La 
preculture a ete remise a 3 0°C une heure avant son 
transfert dans le fermenteur. Le volume final de culture 
est de 15 litres. Les conditions sent les suivantes • 
temperature = 30°C ; agitation = 300 rpm. L ' induction 
avec 1 mM d'IPTC a ete realisee a DO 600 =0,58. Le P H de 
la culture a ete regule a 7 pendant la phase 
d< acidification puis laisse libre lors de la phase 
alcaline. Les bacteries ont ete prelevees apres quatre 
heures d'induction, alors que le pH etait de 8,3. La 
culture a ensuite ete centrifugee puis les cellules ont 
ete divisees en trois lots. L'un d'eux, 20 g de pate, a 
ete repris dans 80 ml de tampon de lyse pour un 
traitement ulterieur indique au chapitre Materiel et 
methodes . 



c) Purification H» T a. DN n n l r 4 ra gs Ha t 
fumicolans. 

La purification a ete .effectuee comme indique 
precedemment (Materiel et Methodes). Pour la colonne 
Heparine -Sepharose, un gradient de 3 a 50% de tampon B, 
correspondant aux volume 365 ml a 13 63 ml, permet de 
recuperer 73 fractions de 6 ml . Le pic d'activite de la 
polymerase est obtenu pour une valeur de gradient de 0,5 
M environ, et correspond aux fractions 55/56 (dosees a 
10 et 12 unites respectivement ) comme indique a la figure 
7, Ces fractions, incubees a 37°C pendant la nuit en 
presence d'ADN de pBR322, degradent 1 ' ADN et presentent 
eh consequence des traces de nuclease de l'h6te non 
visibles sur gel. Leur elimination, ou tout au moins une 
reduction substancielle de leur concentration a ete 
realisee par un passage sur colonne d'af finite (Bleue 
Hi trap) . 

Les fractions 54 a 60, regroupees et dialysees, 
sont chargees a raison de 0,25 ml/mn. L'elution permet 
de recuperer 65 fractions de 5 ml avec des pics 
d'activite pour les fractions 36 a 56. Le dosage de 
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l'activite fait apparaitre une concentration de 3 k 5 
unites pour les fractions 36 a 40. Ces fractions, mises 
en presence d'ADN a 37 °C, pressentent une faible activite 
nucleasique. 

N^anmoins, l'activite sur le plasmide pBR322 a 
37°C toute la nuit montre une nette amelioration de la 
purete de 1' enzyme. Une deuxieme colonne Bleue HiTrap a 
ete reutilisee en prenant les fractions 36 a 44 et 
dialysees comme precedemment . 25ml sur les 30ml de 
fraction ont ete injectes sur la colonne avec un debit de 
0,25ml/min (5 ml etant gardes pour essayer une MonoQ) 
Apres cette deuxieme colonne Bleue HiTrap, l'activite sur 
le plasmide pBR322 ferme et incube toute la nuit avec des 
fractions de la colonne, est nulle. L' incubation d'une 
heure a 72°C de fractions avec I'ADN de Lambda digere par 
Hindlll montre une tres nette degradation, mettant en 
evidence l'activite exonuclease 3 '-5' associee a notre 
ADN polymerase. Le pic d' activite se situe entre les 
fractions 27 et 32. L' ADN polymerase plus pure est done 
sortie plus tdt sur le gradient de NaCl . Sur les 
fractions les plus actives, un comptage a ete realise 
donnant une activite superieure k 5U/ul pour les 
fractions 29, 3 0 et 31. La figure 4 montre le resultat 
sur gel SDS-PAGE. Suite a ces trois colonnes, la purete 
de la polymerase est nettement amelioree. Neanmoins, il 
reste des traces d'ADN de E.coli fix6 k la polymerase et 
mises en Evidence par PCR. Deux colonnes supplementaires 
vont donc-Stre mis en oeuvre. 30ml de fractions actives 
obtenues precedemment sont chargees sur une colonne de 
phosphocellulose (celle-ci devrait fixer differemment 
I'ADN et la polymerase). L'activite de la polymerase est 
reperee par son activite exonucleasique 3 '-5' elevee a 
72 °C sur I'ADN de Lambda digere par Hindlll. L'activite 
la plus forte se situe entre les fractions 40 et 49 avec 
un pic net en 46 et 47. Sur ces fractions 40 a 49 I'ADN 
de pBR322 est intact apres une nuit a 37°C. La figure 5 
nous montre les r^sultats sur gel avec des activites 
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mesurees de 6U/ul pour la fraction 46, 4,5U/ul pour la 47 
et 3U/ul pour la 48. Neanmoins il reste encore des traces 
d'ADN de E. coli. 

Ayant deja mis en evidence que cette polymerase 
' ne se fixe pas sur une MonoQ ou une res source Q et ce 
quel que soit le pH utilise, nous avons essaye de la 
recuperer en exclusion en esperant une fixation de l'ADN 
contaminant par la colonne. 

Tout d'abord un essai a ete realise en sortie 
'de la deuxieme Bleue HiTrap avec 5ml dialyses Les 
resultats ont ete decevants, les fractions d' exclusion 
etant peu actives en incorporation. 

Une deuxieme tentative a ete realisee apres la 
phosphocellulose et apres deux dialyses des fractions les 
15 plus actives 45, 46 et 49. Les fractions sent tout 
d'abord chauffees 40 min a 85°C en raison d'une detection 
de contaminant degradant le pBR322 a 72°C en une nuit. 
Aucune floculation n'est alors visible et l'extrait est 
mis sur glace. Un nouveau test demontre que la 
contamination semble reduite. Apres les dialyses et le 
passage sur colonne, l'activite exonuc leas ique est mise 
en evidence sur les fractions d'exclusion 3 a 7. 
L'activite est dosee a 2U/ul et 1' enzyme est visualisee 
sur la figure 10. Suite a cette derniere etape de 
purification, nous avons obtenu des resultats positifs en 
PCR et comparables a ceux obtenus pour la Vent. 

~ d) Caracterjsation des activity H q s frarHnns 

purjfjees. 

L'activite de l'ADN polymerase des differentes 
fractions a ete dosee par incorporation au 32 P dATP selon 
le protocole decrit en Materiel et Methodes. 

- Amplification rig genes in vitro . 
Un fragment de 459 pb a ete amplifie a partir 
d'un ADN genomique d' Archaebacterie ( Thermococcus sp. GE 
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8) avec des amorces, specifiers. Differents tampons ont 
ete utilises: 

- tampon lOx R: Tris HC1 pH 8,8: 300mM; KC1 : 
500mM; MgC12 : 30mM; Tween 20: 0,1% 

- tampon lOx H: Tris HC1 : pH 8,8: 300 mM; KC1: 
500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx T: Tris HC1 pH 8,8: 600mM; KC1 • 
500mM; MgC12 : 15mM; Tween 20: 0,1% 

- tampon lOx S: Tris Hcl pH 8,8: 200mM; KC1 • 
250mM; MgC12: 20mM; Tween 20: 0,1% ' 

Trente cycles ont ete realises, chacun 
comprenant une etape de denaturation a 94°C pendant 3 0 
sec, une etape d'hybridation des amorces a 51°C pendant 
1 min. puis une etape d' elongation a 72°C pendant 2 min 
La figure 8 presente les resultats obtenus avec un volume 
reactionnel de 50 ul pour des quantites d'ADN polymerase 
de Thermococcus fumicolans de 2,7 unites. En l'etat 
actuel, les meilleurs resultats avec la Tfu sont obtenus 
avec le tampon R. 

La figure 9 represente les resultats de 
1' amplification d'un fragment de 1,6 kb avec la Tfu 
purifiee sur colonnes d'heparine puis de sephacryl-bleue, 
et un tampon reactionnel lOx ayant la composition 
suivante: Tris HC1 pH 8,8: 200mM; KC1 : lOOmM; (NH 4 ) 2 S0 4 : 
lOOmM; MgS04: 20mM; Triton X-100: 1%. 



*• Activity exQnnrU af! i T , a 

Les tests d'activite, selon le protocole 
detaille en Materiels et Methodes, ne revelent pas 
d'activite exonucleasique 5 '-3' chez la Tfu. Ceci est en 
conformite avec la structure de 1 ' enzyme deduite de 
1' analyse de la sequence polypepti digue qui ne fait pas 
apparaitre de domaine fonctionnel exonuclease 5 '-3' 
contrairement a ce qui est observe pour DNA poll de E. 
35 coli et la Taq. 

Les tests d'activite, selon le protocole 
detaille au chapitre Materiels et Methodes, font 
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apparaitre une activite exonucleasique 3 '-5' (activite 
proof-reading ou de correction d'erreurs) chez la Tfu, a 
un niveau sensiblement egal a celui de la Vent coinme 
montre dans le tableau 4 ci-dessous. Le tableau 4 
rapporte la mesure de l'actvite exonucleasique 3 '-5' de 
la Tfu en fonction de la concentration en dNTP, et en 
comparaison avec la Vent. 

Tableau 4 



Cone . dNTP 
(mM) 


Tfu 


Temoin + 
(Vent) 


Temoin - 
(Pab exo-) 


0 


30 000 


25 000 


100 000 


0,1 


40 000 




0,2 


40 000 


56 000 




0,3 


40 000 


58 000 




0,4 


40 000 


70 000 




0,5 








0,75 


40 000 


84 000 




1 


90 000 


106 000 


100 000 



Ces resultats sont en conformite avec la 
structure de 1' enzyme deduite de 1' analyse de la sequence 
polypeptidique qui revele la presence d'un domaine 
exonucleasique 3 '-5' en position N-terminale, ainsi que 
la presence des motifs catalytiques caracteristiques de 
ce domaine. La Tfu est sensible a une concentration de 
l'ordre de 0,8 mM de dNTP, tandis que la Vent manifeste 
une sensibilite des 0,5 mM. Cette activite est connue 
pour ameliorer in vitro la fidelite des polymerases 
utilisees en PCR. 

En outre, cette activite exonucleasique est 
confirmee -par un test plus simple. Les fractions 
purifiees, depourvues d' activite nucleasique a 37°C, 
mises en presence d'ADN de digere par Hindlll puis 
expose a 72 °C pendant la nuit, degradent completement cet 
ADN, mettant ainsi en evidence la presence de 1' activite 
3 '-5' exonuclease de la Tfu ainsi que sa 
thermostabilite . 



- Thermosfcahi 1 i i-* 
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La thermostability mesuree selon le protocole 
decrit precedemment (Materiel et Methodes) , ou mieux, 
l'activite residuelle en incorporation a 72°C apres 
exposition de 1' enzyme a des temperatures elevees pendant 
des temps variables, est donnee dans le tableau 5 ci- 
dessous . 

Tableau 5 



Temperature 
(°C) 


Demi-vie 
oolymerase 


Activite exo 
acres 3h 


92 




100% 


95 


4 h 




100 


2 h 





polymerases issues d'organismes plus hyperthermophiles 
tels que les Pyrococcus. n'en demeure pas moins tres 
largement superieure a celles des polymerases issues des 
Thermus et en particulier toutes les Taq. La 
thermostabilite de 1' enzyme recombinante purifiee, tant 
pour le domaine polymerase que pour 1 ' exonuclease, est de 
toute maniere tres largement superieure a tous les 
besoins connus en PCR. 
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LISTE DE SEQUENCES 

(1) INFORMATION GENERALES ; 

(i) DEPOSANT : APPLIGENE - ONCOR 

(ii) TITRE DE L* INVENTION: ADN POLYMERASE 
THERMOSTABLE D ' ARCHAEBACTERIES DE L * ESPECE 
THERMOCOCCUS fvmicolans 

(iii) NOMBRE DE SEQUENCES: 4 



(2) INFORMATION POUR LA SEQ ID NO : 1 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE- 

(A) LONGUEUR: 5039 paires de bases 

(B) TYPE: nucleotide 

(C) NOMBRE DE BRIN: double 

(D) CONFIGURATION: lineaire 

(ii) TYPE DE MOLECULE: ADN 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ' ADN 
polymerase de THERMOCOCCUS fumicolans Tfu 

(B) EMPLACEMENT :de 457 a 5028 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 ' inteine 
I-Tfu-1 

(B) EMPLACEMENT: de 1675 a 2754 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: sequence codante de 1 1 inteine 
I-Tfu-2 

(B) EMPLACEMENT: de 3157 a 4323 
( ix ) CARACTERI STIQUES 

(A) NOM/CLE: codon stop 

(B) EMPLACEMENT: de 5026 a 5028 

(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO-1 ■ 



AGCTTAAAGC GTCCGCCACT 


ACTTCCTGAA 


AGCTCACGCG 


GTAAAACAGC 


TCCATGCTCG 


60 


GCTCTTCGAT GGGAGGTTTA 


AAAAGGTGGT 


GGTGAGGTTT 


ATTAGGAAGA 


AGGCTCAACT 


120 


AGAGACGGTG GGAGTATGGA 


AGAGGTCGAC 


AGGCTCGTGT 


TCAACTTTCC 


CCTCTTCAAA 


180 


GATTACTGGG AAAAGGAGCG 


GTTCCTCAAG 


GTCGTTGGGC 


TTCTGGTGAG 


CCACCAGATA 


240 


ACGTTTGAGA AAGCTGCCGA 


GCTTCTGGAC 


ATGAGGCTCG 


AAGAGCTGGC 


GTTCCTCCTT 


300 


GACAAGCTCG GCGTTGAGTA 


CTCGCTTCTT 


GATGATGAAG 


AGGCCAGACT 


TGAGAGAGAA 


360 


GAGGCCAATA AGCTCATGGG 


GGAAATGAAG 


GGTGGAGCGT 


TTGTCTGATT 


CTTCTGAGCT 


420 


GTTATTGGTG TTTCACAGGC 


TGGGAGGTGG 


TGGATT ATG 
Met 


ATC CTC GAT ACA GAC 
He Leu Asp Thr Asp 


474 



TAC ATC ACC GAA GAC GGA AGG CCC GTC ATC AGG GTG TTC AAG AAG GAG 
Tyr lie Thr Glu Asp Gly Arg Pro Val lie Arg Val Phe Lys Lys Glu 
10 15 20 



522 
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AAC GGC GAG TTC AAA ATC GAG TAC GAC AGS GAC TTC GAG CCT TAC ATC 
Asn Gly Glu Phe Lys He Glu Tyr Asp Arg Asp Phe Gl'u Pro Tyr lie 
25 30 35 

TAC GCT CTC CTG AAG GAC GAT TCC GCG ATC GAG GAC GTC AAG AAG ATA 
Tyr Ala Leu Leu Lys Asp Asp Ser Ala He Glu Asp Val Lys Lys lie 
40 45 so 

ACT GCA AGC CGG CAC GGT ACC ACC GTC AGG GTC GTC AGG GCC GGG AAG 
Thr Ala Ser Arg His Gly Thr. Thr Val Arg Val Val Arg Ala Gly Lys 
55 60 65 ' 70 

GTG AAG AAG AAG TTC CTC GGC AGG CCG ATA GAG GTC TGG AAG CTC TAC 
Val Lys Lys Lys Phe Leu Gly Arg Pro He Glu Val Trp Lys Leu Tyr 
75 80 85 

TTC ACC CAT CCC CAG GAC GTT CCG GCA ATC AGG GAC AAA ATC AGG GAG 
Phe Thr His Pro Gin Asp Val Pro Ala lie Arg Asp Lys lie Arg Glu 
90 95 ioo 

CAC CCT GCC GTG GTC GAC ATA TAT GAG TAC GAC ATA CCC TTT GCC AAG 
H 1S Pro Ala Val Val Asp He Tyr Glu Tyr Asp He Pro Phe Ala Lys 
105 no 115 

CGC TAC CTC ATC GAT AAG GGC CTC ATC CCG ATG GAG GGC GAC GAG GAG 
Arg Tyr Leu He Asp Lys Gly Leu He Pro Met Glu Gly Asp Glu Glu 
120 125 130 

CTC AAG ATG CTC GCC TTC GAC ATC GAG ACG CTC TAC CAC GAG GGC GAG 
Leu Lys Met Leu Ala Phe Asp He Glu Thr Leu Tyr His Glu Gly Glu 
135 140 145 15Q 

GAG TTC GCC GAG GGG CCT ATT CTT ATG ATA AGC TAT GCC GAC GAG GAA 954 
Glu Phe Ala Glu Gly Pro He Leu Met He Ser Tyr Ala Asp Glu Glu 
155 .160 i 6 5 

GGG GCG AGG GTA ATA ACC TGG AAG AAG ATC GAC CTT CCC TAC GTT GAC 
Gly Ala Arg Val He Thr Trp Lys Lys He Asp Leu Pro Tyr Val Asp 
110 175 180 

GTC GTT TCA ACG GAG AAG GAG ATG ATA AAG CGC TTC CTG AAG GTT GTC 
Val Val Ser Thr Glu Lys Glu Met He Lys Arg Phe Leu Lys Val Val 
185 190 195 

AAG GAG AAG GAC CCC GAT GTC CTC ATA ACC TAC AAC GGC GAC AAC TTC 
Lys Glu Lys Asp Pro Asp Val Leu He Thr Tyr Asn Gly Asp Asn Phe 
200 205 210 

GAC TTC GCT TAC CTC AAG AAG CGC TCC GAG AAG CTC GGC GTT AAG TTC 1146 
Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu Lys Leu Gly Val Lys Phe 
215 220 225 230 

ATC CTC GGA AGG GAC GGC AGC GAG CCG AAG ATA CAG AGG ATG GGC GAC 
He Leu Gly Arg Asp Gly Ser Glu Pro Lys He Gin Arg Met Gly Asd 
235 240 " 245 

CGC TTC GCC GTC GAG GTG AAG GGA AGA ATA CAC TTC GAC CTC TAC CCC 1242 
Arg Phe Ala Val Glu Val Lys Gly Arg He His Phe Asp Leu Tyr Pro 
250 255 260 



570 



618 



666 



714 



762 



810 



858 



906 



1002 



1050 



1098 



1194 
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w „ w „^ wu uuu AAC AAG CCC TCC GGC 

Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala Pro Asn Lys Pro Ser Gly 
360 365 J - y 



AGA GAA CTT GAG AGG CGC CGC GGG GGC TAC GCC GGC GGC TAC GTC AAG 
Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr Ala Gly Gly Tyr Val Lys 
3'5 400 



405 410 



1290 



1338 



GTC ATA AGA CAC ACC ATC AAC CTG CCC ACC TAC ACG CTG GAG GCC GTC 
Val lie Arg His Thr He Asn Leu Pro Thr Tyr Thr Leu Glu Ala Val 
265 270 275 

TAC GAG GCG ATT TTT GGG CAG CCA AAG GAG AAG GTC TAC GCT GAG GAG 
Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu Lys Val Tyr Ala Glu Glu 
280 285 290 

ATA' GCG CAG GCC TGG GAA ACG GGC GAG GGG CTT GAG CGC GTC GCG CGC 13 86 
lie Ala Gin Ala Trp Glu Tor Gly Glu Gly Leu Glu Arg Val Ala Arg 
295 300 305 310 

TAC TCG ATG GAG GAC GCC AAG GTA ACC TAC GAG CTG GGA AGG GAG TTC 
Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr Glu Leu Gly Arg Glu Phe 
315 320 3 25 

TTC CCG ATG GAG GCC CAA CTT TCT CGG CTG GTC GGT CAG AGC TTC TGG 
Phe Pro Met Glu Ala Gin Leu Ser Arg Leu Val Gly Gin Ser Phe Tro 
330 335 " 34 0 

GAC , GTC TCG CGC TCC AGC ACC GGC AAC CTC GTC GAG TGG TAC CTC CTC 153 0 
Asp Val Ser Arg Ser Ser Thr Gly Asn Leu Val Glu Trp Tyr Leu Leu 
345 350 355 

a™ f^? I A f ^ C ? AG CTG GCA CCG AAC AAG CCC TCC GGC 1578 

""""" '"'** * * ' ' Asn 

370 



1434 



1482 



1626 



1722 



1770 



1818 



GAG CCG GAG AGG GGA CTT TGG GAG AAC ATA GCT TAT TTA GAT TTT AGG 1674 
Glu Pro Glu Arg Gly Leu Trp Glu Asn lie Ala Tyr Leu Asp Phe Arg 
415 420 425 

SOS CAT CCT GCC GAC ACT AAA GTC ATT GTC AAA GGG AAG GGC GTT GTA 
Cys His Pro Ala Asp Thr Lys Val He Val Lys Gly Lys Gly Val Val 
430 435 440 

AAC ATC AGC GAA GTT AGG GAG GGG GAC TAC GTT CTC GGC ATA GAC GGC 
Asn lie Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
445 450 455 

TGG CAG AAG GTT CAA AGG GTC TGG GAG TAT GAT TAC GAG GGA GAA CTC 
Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
460 465 470 

GTA AAT ATA AAC GGC CTT AAG TGC ACA CCG AAC CAT AAG CTT CCG GTC 1866 
Val Asn He Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
475 4 8° 485 4 9 o 

GTT AGG AGG ACT GAG AGG CAG ACT GCG ATA AGG GAC AGC CTT GCA AAG 1914 
Val Arg Arg Thr Glu Arg Gin Thr Ala He Arg Asp Ser Leu Ala Lys 
495 500 505 

TCT TTT CTC ACG AAA AAA GTT AAA GGT AAG CTG ATA ACC ACG CCT CTC 1962 
Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu He Thr Thr Pro Leu 
510 515 520 
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2010 



2058 



2154 



TTT GAA AAA ATC GGG AAG ATC GAG CGA GAG GAC GTG CCA GAA GAG GAG 
Phe Glu Lys lie Gly Lys lie Glu Arg Glu Asp Val Pro Glu Glu Glu 
525 530 535 

ATA CTC AAA GGA GAA CTC GCC GGA ATA ATC CTG GCT GAG GGC ACA CTC 
lie Leu Lys Gly Glu Leu Ala Gly lie He L eu Ala Glu Gly Thr Leu 
540 545 550 

CTG AGA AAG GAT GTC GAG TAC TTT GAC TCT TCC AGA GGG AAG AAG AGA 2106 
Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
555 560 565 570 

GTA TCA CAC CAG TAC AGG GTT GAA ATA ACC GTT GGG GCG CAG GAG GAG 
Val Ser His Gin Tyr Arg Val Glu lie Thr Val Gly Ala Gin Glu Glu 
575 580 585 

GAC TTC CAG AGG AGG ATC GTT TAC ATT TTC GAA CGC CTC TTT GGG GTA 2202 
Asp Phe X Arg Arg He Val Tyr lie Phe Glu Arg Leu Phe Gly Val 
590 595 ~ 600 

ACT CCC AGT GTT TAC CGG AAA AAG AAC ACA AAC GCA ATA ACG TTC AAA 
Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala lie Thr Phe Lys 
6 °5 610 615 

GTT GCC AAA AAA GAG GTT TAT CTT AGG GTT AGG GAA ATT ATG GAT GGC 2298 
Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu lie Met Asp Gly 
620 625 630 

ATT GAG AAC CTC CAC GCT CCT TCT GTG TTA AGG GGC TTT TTT GAA GGA 
lie Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 
635 640 645 650 

GAC GGA AGC GTC AAC AAG GTC CGG AAG ACA GTG GTA GTG AAT CAG GGC 2394 
Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
655 660 665 

ACC AAT AAT GAA TGG AAA ATT GAA GTG GTG TCA AAA CTC CTC AAC AAG 2442 
Thr Asn Asn Glu Trp Lys lie Glu Val Val Ser Lys Leu Leu Asn Lys 
670 675 680 

TTG GGG ATT CCG CAT AGA AGG TAC ACA TAC GAT TAC ACC GAA AGA GAA 
Leu Gly lie Pro_His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
685 690 695 



2250 



2346 



2490 



AAA ACC ATG ACA ACG CAT ATA CTT GAG ATA GCC GGC AGG GAT GGG TTA 2538 
Lys Thr Met Thr Thr His He Leu Glu He Ala Gly Arg Asp Gly Leu 
'00 70S 710 

A ^, c , CTT cpijiQ CAG ACC ATT GTG GGA TTC ATA AGC ACT GAG AAG AAC ATG 
lie Leu Phe Gin Thr lie Val Gly Phe lie Ser Thr Glu Lys Asn Met 
715 720 725 730 

GCG CTG GAG GAG GCA ATC AGG AAC AGG GAA GTG AAC CGC CTA GAA AAC 
Ala Leu Glu Glu Ala lie Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
735 740 745 

AAT GCC TTC TAT ACC CTA GCC GAC TTT ACG GCG AAG ACA GAG TAC TAC 2682 
Asn Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tvr Tvr 
750 755 " 780 



2586 



2634 
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2826 



2874 



2922 



2970 



AAG GGC AAA GTT TAC GAC TTA ACC CTT GAG GGA ACG CCC TAT TAG TTC 273 0 
Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
7 85 790 795 

GCC AAT GGC ATA CTG ACC CAC AAT TCS CTA TAT CCT TCG ATT ATA ATT 2778 
Ala Asn Gly lie Leu Thr His Asn Ser Leu Tyr Pro Ser lie He He 
800 805 810 

TCC CAC AAC GTC TCC CCC GAT ACG CTC AAC CGC GAG GGC TGC GGG GAG 
Ser His Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu 
815 820 825 830 

TAC GAC GAG GCT CCG CAG GTA GGG CAT CGC TTT TGT AAG GAC TTC CCC 
Tyr Asp Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro 
835 840 845 

GGC TTC ATC CCC AGC CTC CTC GGT GAC CTG CTC GAC GAG AGG CAG AAG 
Gly Phe He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lys 
855 860 ' 865 

GTA AAG AAG CAC ATG AAG GCC ACG GTG GAC CCG ATA GAG AAG AAG CTC 
Val Lys Lys His Met Lys Ala Thr Val Asp Pro lie Glu Lys Lys Leu 
870 875 880 

CTC GAT TAC AGG CAG CGC GCA ATT AAA ATC CTC GCC AAC AGC TTC TAC 3 018 
Leu Asp Tyr Arg Gin Arg Ala He Lys lie Leu Ala Asn Ser Phe Tyr 
885 890 895 

GGC TAC TAT GGC TAC GCA AAG GCC CGC TGG TAC TGC AAG GAG TGC GCC 3 066 
Gly Tyr Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cys Ala 
900 905 910 915 

GAG AGC GTT ACC GCC TGG GGC AGG CAG TAC ATT GAG ACC ACC ATG AGG 
Glu Ser Val Thr Ala Trp Gly Arg Gin Tyr He Glu Thr Thr Met Arq 
920 925 930 

GAA ATA GAG GAA AAA TTT GGC TTT AAA GTG CTG TAC GCG GAT AST GTT 3162 
Glu He Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Ser Val 
535 940 " 94S 

ACA GGG GAC ACA GAG GTA ACC ATC AGA AGA AAC GGC AGG ATT GAG TTC 3210 
Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He Glu Phe 
950 955 9 6 o 

GTT CCA ATC GAG AAA CTC TTT GAG CGC GTT GAT CAC CGT GTT GGT GAG 
Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val Gly Glu 
965 970 975 

AAG GAG TAC TGC GTT CTT GGA GGG GTT GAG GCA CTG ACA CTC GAC AAC 
Lys Glu Tyr Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu Asp Asn 
980 98 5 990 995 

AGG GGC AGG CTC GTG TGG AAG AAG GTT CCG TAC GTC ATG AGA CAT AAA 33 54 
Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Arg His Lys 
1000 1005 10 io 

ACG GAC AAA AGA ATC TAT AGG GTA TGG TTC ACC AAC TCT TGG TAC CTT 
Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp Tyr Leu 
1015 1020 1025 



3114 



3258 



3306 



3402 
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GAC GTG ACG GAG GAT CAC TCG' CTA ATA GGC TAC CTG AAC ACA AGC AAA 3450 
Asp Val Thr Glu Asp His Ser Leu He Gly Tyr Leu Asn Thr Ser Lys 
1030 1035 1040 

GTC AAA CCC GGA AAG CCC TTG AAA GAG CGT CTC GTC GAG GTC AAG CCA 3498 
Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val Lvs Pro 
1045 1050 1055 

GAA GAA TTG GGG GGT AAG GTC AAG TCT CTC ATT ACG CCC AAT CGG CCA 3 546 
Glu Glu Leu Gly Gly Lys Val Lys Ser Leu He Thr Pro Asn Arq Pro 
1060 1065 1070 1075 

ATT GCC CGT ACC ATC AAG GCC AAC CCC ATT GCC GTC AAG CTC TGG GAG 3 594 
He Ala Arg Thr He Lys Ala Asn Pro He Ala Val Lys Leu Trp Glu 
1080 1085 " 1090 

TTA ATT GGC CTG CTG GTG GGA GAT GGC AAC TGG GGT GGA CAA TCG AAC 3642 
Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin Ser Asn 
1095 iioo 1105 

TGG GCC AAA TAC TAC GTT GGC CTC TCG TGT GGG CTG GAT AAA GCC GAA 3 690 
Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys Ala Glu 
1110 U15 n20 

ATA GAG AGA AAA GTC CTG AAC CCT TTA AGA GAG GCA AGC GTC ATC TCC 3738 
He Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val He Ser 
1125 H30 1135 

AAC TAC TAC GAC AAG AGC AAG AAG GGC GAC GTT TCC ATA CTC TCC AAG 37 86 
Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser He Leu Ser Lvs 
U40 1145 nso ilss 

TGG CTC GCC GGA TTC ATG GTC AAA TAC TTC AAA GAT GAA AAT GGG AAC 3834 
Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn Gly Asn 
H60 U65 H70 

AAG GCC ATT CCC AGC TTC ATG TTC AAC CTT CCA AGG GAA TAC ATA GAG 3 882 
Lys Ala He Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr He Glu 
1175 nso HB5 

GCC TTT CTA CGG GGG CTG TTT TCA GCG GAC GGA ACG GTA AGC TTG CGT 3 93 0 
Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser Leu Ara 
H90 1195 1200 

AGA GGA ATC CCA GAA ATT AGA CTG ACA AGC GTT AAC AGA GAG CTT AGT 3 97 8 
Arg Gly He Pro Glu He Arg Leu Thr Ser Val Asn Arg Glu Leu Ser 
1205 1210 1215 

GAT GCC GTG AGA AAG TTG CTG TGG CTG GTT GGG GTC TCC AAC TCA CTA 4026 
Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn Ser Leu 
1220 1225 1230 i 23 5 

TTC ACC GAA ACC AAG CCA AAC CGG TAC CTG GAG AAA GAA AGT GGA ACG 4074 
Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser Gly Thr 
1240 1245 1250 

CAT TCG ATT CAC GTG AGG ATA AAG AAC AAG CAT CGC TTT GCC GAT AGA 4122 
His Ser He His Val Arg He Lys Asn Lys His Arg Phe Ala Asp Arq 
1255 1260 1265 
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ATA GGC TTT CTC ATA GAC AGA AAA TCC ACC AAA CTC TCC GAG AAC CTG 
lie Gly Phe Leu He Asp Arg Lys Ser Thr Lys Leu Ser Glu Asn Leu 
1270 1275 1280 

GGG GGA CAT ACA AAC AAG AAG AGG GCT TAC AAA TAT GAT TTT GAC TTG 
Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe Asp Leu 
1285 1290 1295 

GTA TAC CCC AGA AAA ATC GAA GAG ATA ACC TAC GAC GGC TAC GTC TAT 
Val Tyr Pro Arg Lys He Glu Glu He Thr Tyr Asp Gly Tyr Val Tyr 
1300 1305 i3io * X 3 15 

GAC ATC GAG GTT GAG GGA ACC CAC AGG TTC TTC GCC AAC GGA ATA CTC 
Asp He Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly He Leu 
1320 1325 1330 

GTT CAC AAC Att GAC GGC TTT TTC GCA ACA ATC CCC GGA GCG GAC GCC 
Val His Asn Thr Asp Gly Phe Phe Ala Thr He Pro Gly Ala Asp Ala 
1335 1340 1345 

GAG ACG GTC AAA AAG AAG GCC AGG GAG TTC CTT AAC TAC ATT AAC CCC 
Glu Thr Val Lys Lys Lys Ala Arg Glu Phe Leu Asn Tyr He Asn Pro 
1350 1355 136O 

AAG CTG CCC GGT CTC CTC GAA CTC GAG TAC GAG GGC TTC TAC AGG CGC 
Lys Leu Pro Gly Leu Leu Glu Leu Glu Tyr Glu Gly Phe Tyr Ara Ara 
1365 1370 " 1375 

GGT TTC TTC GTA ACC AAG AAG AAG TAC GCG GTG ATA GAC GAG GAG GGC 
Gly Phe Phe Val Thr Lys Lys Lys Tyr Ala Val He Asp Glu Glu Glv 
1380 1385 1390 1395 

AAG ATA ACG ACG CGC GGG CTT GAG ATC GTC CGG CGC GAC TGG AGT GAG 
Lys He Thr Thr Arg Gly Leu Glu He Val Arg Arg Asp Trp Ser Glu 
1400 1405 1410 

GTG G£T AAG GAG ACG CAG GCG AGG GTC TTG GAG GCC ATA CTG CGG CAC 
Val Ala Lys Glu Thr Gin Ala Arg Val Leu Glu Ala He Leu Arg His 
1415 1420 1425 

GGT GAC GTC GAG GAG GCC GTG AGG ATT GTC AAG GAA GTG ACG GAA AAG 
Gly Asp Val Glu Glu Ala Val Arg He Val Lys Glu Val Thr Glu Lvs 
1430 1435 144Q 

CTG AGC AAG TAC GAG GTT CCG CCA GAG AAG CTC GTC ATC CAC GAG CAG 
Leu Ser Lys Tyr Glu Val Pro Pro Glu Lys Leu Val He His Glu Gin 
1445 1450 1455 

ATT ACC AGG GAG CTG AAG GAC TAC AAG GCC ACC GGC CCG CAC GTG GCC 
He Thr Arg Glu Leu Lys Asp Tyr Lys Ala Thr Gly Pro His Val Ala 
1460 1465 1470 1475 

ATA GCG AAG CGC CTC GCC GCG AGG GGG ATT AAG GTT CGC CCT GGG ACA 
He Ala Lys Arg Leu Ala Ala Arg Gly lie Lys Val Arg Pro Gly Thr 
' 1480 1485 1490 

GTC ATC AGC TAC ATC GTC CTG AAA GGT TCC GGC AGG ATA GGG GAC AGG 
Val He Ser Tyr He Val Leu Lys Gly Ser Gly Arg He Gly Asp Arg 
1495 1500 15 o5 



4170 



4218 



4266 



4314 



4362 



4410 



4458 



4506 



4554 



4602 



4650 



4698 



4746 



4794 



4842 
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ACQ ATA CCC TTC GAC GAG TTC GAC CCC ACG AAG CAC AGG TAG GAT GCG 4890 
Thr lie Pro Phe Asp Glu Phe Asp Pro Thr Lys His Arg Tyr Asp Ala 
lbl ° 1515 1520 

GAG TAC TAG ATC GAG AAC CAG GTT CTG CCG GCG GTG GAG AGA ATC CTC 4938 
Glu Tyr Tyr He Glu Asn Gin Val Leu Pro Ala Val Glu Arg lie Leu 
1525 1530 



1535 



AAG GCC TTC GGC TAC AAG AAG GAG GAT TTG CGC TAC CAG AAG ACG CGG 4986 

Lys Ala Phe Gly Tyr Lys Lys Glu Asp Leu Arg Tyr Gin Lys Thr Arg 
1540 154 5 1550 1555 

CAG GTT GGG CTG GGG GCG TGG CTC AAA ATG GGG AAG AAA TGA 502 8 

Gin Val Gly Leu Gly Ala Trp Leu Lys Met Gly Lys Lys 
1560 1565 1568 

AGGCCAAGCT T 



(2) INFORMATION POUR LA SEQ ID NO: 2 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE • 

(A) LONGUEUR: 774 acides amines 
(11) TYPE DE MOLECULE: proteine 
( ix ) CARACTERISTIQUES 

(A) NOM/CLE: ADN polymerase de THERMOCOCCUS 

fumicolans Tfu 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 2 : 

Met He Leu Asp Thr Asp Tyr lie Thr Glu Asp Gly Arg Pro Val lie 
1 5 10 15 

Arg Val Phe Lys Lys Glu Asn Gly Glu Phe Lys lie Glu Tyr Asp Arg 
20 25 30 

Asp Phe Glu Pro Tyr lie Tyr Ala Leu Leu Lys Asp Asp Ser Ala He 
35 40 45 

Glu Asp Val Lys Lys He Thr Ala Ser Arg His Gly Thr Thr Val Arg 
50 55 60 

Val Val Arg Ala Gly Lys Val Lys Lys Lys Phe Leu Gly Arg Pro He 
65 . 70 75 so 

Glu Val Trp Lys Leu Tyr Phe Thr His Pro Gin Asp Val Pro Ala He 
85 90 95 

Arg Asp Lys He Arg Glu His Pro Ala Val Val Asp He Tyr Glu Tyr 
100 105 no 

Asp He Pro Phe Ala Lys Arg Tyr Leu He Asp Lys Gly Leu lie Pro 
115 120 125 

Met Glu Gly Asp Glu Glu Leu Lys Met Leu Ala Phe Asp He Glu Thr 
130 135 140 

Leu Tyr His Glu Gly Glu Glu Phe Ala Glu Gly Pro He Leu Met He 
145 150 155 i 6 o 

Ser Tyr Ala Asp Glu Glu Gly Ala Arg Val He Thr Trp Lys Lys He 
165 170 175 



5039 
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Asp Leu Pro Tyr Val Asp. Val Val Ser Thr Glu Lys Glu Met He Lvs 
180 185 190 

Arg Phe Leu Lys Val Val Lys Glu Lys Asp Pro Asp Val Leu lie Thr 
195 200 205 

Tyr Asn Gly Asp Asn Phe Asp Phe Ala Tyr Leu Lys Lys Arg Ser Glu 
210 215 220 

Lys Leu Gly Val Lys Phe lie Leu Gly Arg Asp Gly Ser Glu Pro Lys 
225 



230 



235 



240 



He Gin Arg Met Gly Asp Arg Phe Ala Val Glu Val Lys Gly Arg He 

245 250 " 255 

His Phe Asp Leu Tyr Pro Val lie Arg His Thr lie Asn Leu Pro Thr 
260 265 270 

Tyr Thr Leu Glu Ala Val Tyr Glu Ala lie Phe Gly Gin Pro Lys Glu 
275 280 285 

Lys Val Tyr Ala Glu Glu He Ala Gin Ala Trp Glu Thr Gly Glu Glv 

290 "> QC 



295 



300 



Leu Glu Arg Val Ala Arg Tyr Ser Met Glu Asp Ala Lys Val Thr Tyr 
305 310 315 ' 320 

Glu Leu Gly Arg Glu Phe Phe Pro Met Glu Ala Gin Leu Ser Arg Leu 
325 330 335 

Val Gly Gin Ser Phe Trp Asp Val Ser Arg Ser Ser Thr Gly Asn Leu 
340 345 350 

Val Glu Trp Tyr Leu Leu Arg Lys Ala Tyr Glu Arg Asn Glu Leu Ala 
355 360 3 6 5 

Pro Asn Lys Pro Ser Gly Arg Glu Leu Glu Arg Arg Arg Gly Gly Tyr 
370 375 38O 

Ala Gly Gly Tyr Val Lys Glu Pro Glu Arg Gly Leu Trp Glu Asn He 
385 390 395 400 

Ala Tyr Leu Asp Phe Arg Ser Leu Tyr Pro Ser He He He Ser His 
405 405 410 

Asn Val Ser Pro Asp Thr Leu Asn Arg Glu Gly Cys Gly Glu Tyr Asp 
415 420 425 

Glu Ala Pro Gin Val Gly His Arg Phe Cys Lys Asp Phe Pro Gly Phe 
430 



435 



440 



He Pro Ser Leu Leu Gly Asp Leu Leu Asp Glu Arg Gin Lys Val Lvs 

445 ^crk r 



450 



455 



Lys His Met Lys Ala Thr Val Asp Pro lie Glu Lys Lys Leu Leu Asp 



465 



470 



475 



Tyr Arg Gin Arg Ala He Lys He Leu Ala Asn Ser Phe Tyr Gly Tvr 
480 485 49 £ 
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Tyr Gly Tyr Ala Lys Ala Arg Trp Tyr Cys Lys Glu Cy 3 Ala Glu Ser 
495 S00 505 

Val Thr Ala Trp Gly Arg Gin Tyr lie Glu Thr Thr Met Arg Glu He 
510 515 520 

Glu Glu Lys Phe Gly Phe Lys Val Leu Tyr Ala Asp Thr Asp Gly Phe 
525 530 535 

Phe Ala Thr He Pro Gly Ala. Asp Ala Glu Thr Val Lys Lys Lys Ala 



545 



555 



560 



Arg Glu Phe Leu Asn Tyr lie Asn Pro Lys Leu Pro Gly Leu Leu Glu 
565 570 575 

Leu Glu Tyr Glu Gly Phe Tyr Arg Arg Gly Phe Phe Val Thr Lys Lys 



585 



590 



Lys Tyr Ala Val lie Asp Glu Glu Gly Lys lie Thr Thr Arg Gly Leu 
595 600 605 

Glu lie Val Arg Arg Asp Trp Ser Glu Val Ala Lys Glu Thr Gin Ala 
610 615 620 

Arg Val Leu Glu Ala He Leu Arg His Gly Asp Val Glu Glu Ala Val 
625 630 635 640 

Arg lie Val Lys Glu Val Thr Glu Lys Leu Ser Lys Tyr Glu Val Pro 
645 650 655 

Pro Glu Lys Leu Val He His Glu Gin He Thr Arg Glu Leu Lys Asp 
660 r r *~ 



665 



670 



Tyr Lys Ala Thr Gly Pro His Val Ala He Ala Lys Arg Leu Ala Ala 
675 680 6 85 

Arg Gly He Lys Val Arg Pro Gly Thr Val He Ser Tyr He Val Leu 
690 695 700 

Lys Gly Ser Gly Arg lie Gly Asp Arg Thr lie Pro Phe Asp Glu Phe 

Asp Pro Thr Lys His Arg Tyr Asp Ala Glu Tyr Tyr He Glu Asn Gin 
725 730 735 

Val Leii Pro Ala Val Glu Arg lie Leu Lys Ala Phe Gly Tyr Lys Lvs 
740 745 75Q 

Glu Asp Leu Arg Tyr Gin Lys Thr Arg Gin Val Gly Leu Gly Ala Trp 
755 760 765 

Leu Lys Met Gly Lys Lys 
770 774 
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(2) INFORMATION POUR LA SEQ ID NO: 3 : 

(i) CARACTRERISTIQUES DE LA SEQUENCE : 
(A) LONGUEUR: 360 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix ) CARACTERISTIQUES 

(A) NOM/CLE: inteine I-Tfu-1 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 3 : 

Cys His Pro Ala Asp Thr Lys Val He Val Lys Gly Lys Gly Val Val 
1 5 10 15 

Asn lie Ser Glu Val Arg Glu Gly Asp Tyr Val Leu Gly lie Asp Gly 
20 25 30 

Trp Gin Lys Val Gin Arg Val Trp Glu Tyr Asp Tyr Glu Gly Glu Leu 
35 40 45 

Val Asn lie Asn Gly Leu Lys Cys Thr Pro Asn His Lys Leu Pro Val 
50 55 60 

Val Arg Arg Thr Glu Arg Gin Thr Ala lie Arg Asp Ser Leu Ala Lys 
65 70 75 80 

Ser Phe Leu Thr Lys Lys Val Lys Gly Lys Leu lie Thr Thr Pro Leu 
85 90 95 

Phe Glu Lys He Gly Lys He Glu Arg Glu Asp Val Pro Glu Glu Glu 
100 105 no 

He Leu Lys Gly Glu Leu Ala Gly He He Leu Ala Glu Gly Thr Leu 
115 120 125 

Leu Arg Lys Asp Val Glu Tyr Phe Asp Ser Ser Arg Gly Lys Lys Arg 
130 135 140 

Val Ser His Gin Tyr Arg Val Glu He Thr Val Gly Ala Gin Glu Glu 
145 150 155 leo 

Asp Phe X Arg Arg He Val Tyr He Phe Glu Arg Leu Phe Gly Val 
165 no 175 

Thr Pro Ser Val Tyr Arg Lys Lys Asn Thr Asn Ala He Thr Phe Lys 
180 185 190 

Val Ala Lys Lys Glu Val Tyr Leu Arg Val Arg Glu lie Met Asp Gly 
19 5 200 205 

He Glu Asn Leu His Ala Pro Ser Val Leu Arg Gly Phe Phe Glu Gly 
210 215 220 

Asp Gly Ser Val Asn Lys Val Arg Lys Thr Val Val Val Asn Gin Gly 
225 "0 235 240 

Thr Asn Asn Glu Trp Lys He Glu Val Val Ser Lys Leu Leu Asn Lys 
245 2S0 255 

Leu Gly He Pro His Arg Arg Tyr Thr Tyr Asp Tyr Thr Glu Arg Glu 
260 265 270 
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Lys Thr Met Thr Thr His He Leu Glu lie Ala Gly Arg Asp Gly Leu 
275 280 285 

lie Leu Phe Gin Thr He Val Gly Phe He Ser Thr Glu Lys Asn Met 
290 295 300 

Ala Leu Glu Glu Ala lie Arg Asn Arg Glu Val Asn Arg Leu Glu Asn 
305 310 315 320 

Asn; Ala Phe Tyr Thr Leu Ala Asp Phe Thr Ala Lys Thr Glu Tyr Tyr 
325 330 335 

Lys Gly Lys Val Tyr Asp Leu Thr Leu Glu Gly Thr Pro Tyr Tyr Phe 
340 345 350 

Ala Asn Gly He Leu Thr His Asn 
355 360 

(2) INFORMATION POUR LA SEQ ID NO: 4 : 

(i) CARACTRERI STIQUES DE LA SEQUENCE: 
(A) LONGUEUR: 389 acides amines 

(ii) TYPE DE MOLECULE: proteine 
( ix) CARACTERI STIQUES 

(A) NOM/CLE: inteine I-Tfu-2 
(xi) DESCRIPTION DE LA SEQUENCES: SEQ ID NO: 4 : 

Ser Val Thr Gly Asp Thr Glu Val Thr He Arg Arg Asn Gly Arg He 
1 5 10 15 

Glu Phe Val Pro He Glu Lys Leu Phe Glu Arg Val Asp His Arg Val 
20 25 30 

Gly Glu Lys Glu Tyr, Cys Val Leu Gly Gly Val Glu Ala Leu Thr Leu 
35 40 45 

Asp Asn Arg Gly Arg Leu Val Trp Lys Lys Val Pro Tyr Val Met Ara 
50 55 60 

His Lys Thr Asp Lys Arg He Tyr Arg Val Trp Phe Thr Asn Ser Trp 
65 70 75 80 

Tyr Leu Asp Val Thr Glu Asp His Ser Leu He Gly Tyr Leu Asn Thr 
85 90 95 

Ser Lys Val Lys Pro Gly Lys Pro Leu Lys Glu Arg Leu Val Glu Val 
100 105 " no 

Lys Pro Glu Glu Leu Gly Gly Lys Val Lys Ser Leu He Thr Pro Asn 
115 120 125 

Arg Pro He Ala Arg Thr He Lys Ala Asn Pro He Ala Val Lys Leu 
130 135 140 

Trp Glu Leu He Gly Leu Leu Val Gly Asp Gly Asn Trp Gly Gly Gin 
145 ' I 50 155 ^ " 160 

Ser Asn Trp Ala Lys Tyr Tyr Val Gly Leu Ser Cys Gly Leu Asp Lys 
165 170 175 
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Ala Glu lie Glu Arg Lys Val Leu Asn Pro Leu Arg Glu Ala Ser Val 

180 185 ' 190 

He Ser Asn Tyr Tyr Asp Lys Ser Lys Lys Gly Asp Val Ser lie Leu 

195 200 205 

Ser Lys Trp Leu Ala Gly Phe Met Val Lys Tyr Phe Lys Asp Glu Asn 

215 220 

Gly Asn Lys Ala lie Pro Ser Phe Met Phe Asn Leu Pro Arg Glu Tyr 



230 



235 



240 



He Glu Ala Phe Leu Arg Gly Leu Phe Ser Ala Asp Gly Thr Val Ser 

245 250 ' 255 

Leu Arg Arg Gly lie Pro Glu lie Arg Leu Thr Ser Val Asn Arg Glu 

260 265 270 

Leu Ser Asp Ala Val Arg Lys Leu Leu Trp Leu Val Gly Val Ser Asn 

275 280 285 

Ser Leu Phe Thr Glu Thr Lys Pro Asn Arg Tyr Leu Glu Lys Glu Ser 

230 295 300 

Gly Thr His Ser lie His Val Arg lie Lys Asn Lys His Arg Phe Ala 



310 



315 



320 



Asp Arg He Gly Phe Leu lie Asp Arg Lys Ser Thr Lys Leu Ser Glu 
325 330 335 

Asn Leu Gly Gly His Thr Asn Lys Lys Arg Ala Tyr Lys Tyr Asp Phe 
340 345 



350 



Asp Leu Val Tyr Pro Arg Lys lie Glu Glu lie Thr Tyr Asp Gly Tyr 
355 360 3 65 

Val Tyr Asp He Glu Val Glu Gly Thr His Arg Phe Phe Ala Asn Gly 
370 375 * 



380 



He Leu Val His Asn 
385 389 
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REVENDICATIONS 



1) ADN polymerase purifiee thermostable 
d'archabacteries de 1 • espece Thermococcus fumicolans 
ayant un poids moleculaire de l'ordre de 89 000 daltons 
et ses derives enzymatiquement equivalents. 

2) ADN polymerase selon la revendication 1 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ id NO:l ou 
un fragment de celle-ci ou encore un assemblage de tels 
fragments . 

3) ADN polymerase selon la revendication 2 dont 
la sequence en acides amines est representee dans la 
liste de sequence en annexe sous le numero SEQ ID NO:2. 

4) Une sequence d'ADN constitute par ou 
comprenant la sequence codant pour une ADN polymerase 
selon quelconque des revendications 1 a 3. 

5) Une sequence d'ADN selon la revendication 4 
constitute par ou comprenant la sequence comprise entre 
les nucleotides 357 a 5028 de la sequence SED ID NO: 1, 
ou un fragment de celle-ci ou encore un assemblage de 
tels fragments. 

6) Une sequence d'ADN selon l'une des 
revendications 4 a 5 constitute par ou comprenant les 
nucleotides 357 a 1674 et 2755 a 3156 et 4324 a 5028 de 
la sequence d'ADN representee dans la liste de sequences 
en annexe sous le numero SED ID NO: 1. 

7) Un vecteur contenant la sequence d'ADN de 
l'une quelconque des revendications 4 a 6. 
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8) Un hote transforme par un vecteur selon la 
revendication 7 . 

9) Procede de preparation d'une ADN polymerase 
thermostable d' archaebacteries de l'espece Thermococcus 
fumicolans, caracterise en ce que l'on cultive 1'hSte 
selon la revendication 8 dans des conditions permettant 
1* expression de ladite ADN polymerase et en ce que l'on 
extrait et recupere celle-ci par tout moyen approprie. 

10) Procede d' amplification enzymatique d'une 
sequence d'acide nucleique caracterise en ce que l'on met 
en oeuvre une ADN polymerase thermostable selon l'une 
quelconque des revendications 1 a 3 . 

11) Inteine purifiee thermostable 
d'archaebacteries de l'espece Thermococcus fumicolans. 
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Fig. 3 



EB S Pab 46 50 51 52 PM 59 60 




Pab 53 54 55 56 57 58 M 



212 kDa-K 
170 * 

116> 
76-* 

54 




EB = extrait brut de sonication 

S = surnageant chauffe 

Pab = 50U de Pab 

PM = poids moleculaire en kDa 
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Fig .4 



28 



29 



30 



31 



32 



33 



M 



kDa 





28, 29, 30, 31, 32, 33: fractions aprks la deuxieme Bleue 

P: phosphorylase B (92 kDa) 

M: marqueur de poids moldculaire 
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Fig. 5 



P 46 47 48 49 M kDa 




P: phosphorylase B (92 kDa) 

46, 47, 48, 49: fractions apres phosphocellulose 

M: marqueur de poids moleculaire 
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Pig. 6 



p 234567 M KDa 



92KDa 




P: phosphorylase B (92 kDa) 

2, 3, 4, 5, 6, 7: fractions d' exclusions sur MonoQ 

M: marqueur de poids moleculaire 
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Fig. 7 



i fractions d'exclusion de la MonoQ 



vent Taqpol Raoul kb 




FEUILLE DE REMPLACEMENT (REGLE 26) 



INTERNATIONAL SEARCH REPORT 



International Application No 

PCT/FR 97/G0761 



A. CLASSIFICATION OF SUBJECT MATTER 

IPC 6 C12N9/12 //C12N15/54 



According to International Patent Classification (IPC) or to both national classification and IPC 



B. FIELDS SEARCHED 



Minimum documentation searched (classification system followed by classification symbols) 

IPC 6 C12N 



Documentation searched other than minimum documentation to the extent that such documents are included in the fields searched 



Electronic data base consulted during the international search (name of data base and, where practical, search terms used) 



C. DOCUMENTS CONSIDERED TO BE RELEVANT 



Category 8 Citation of document, with indication, where appropriate, of the relevant passages 



Relevant to claim No. 



PIETROKOVSKI S: "A new intein in 

cyanobacteri a and its significance for the 

spread of inteins" 

TRENDS IN GENETICS, 

vol. 12, no. 8, August 1996, 

page 287-288 XPOO4037128 

see the whole document 



11 



0 



Further documents are listed in the continuation of box C. 



m 



Patent family members are listed In annex. 



0 Special categories of cited documents : 

*A" document defining the general state of the art which is not 
considered to be of particular relevance 

"E" earlier document but published on or after the international 
filing date 

"L" document which may throw doubts on priority olaim(s) or 
which is cited to establish the publication date of another 
crtauon or other special reason (as specified) 

'O* document referring to an oral disclosure, use, exhibition or 
other means 

"P* document published prior to the international filing date but 
later than the priority date claimed 



T later document published after the international filing date 
or priority date and not In conflict with the application but 
cited to understand the principle or theory underlying the 
invention 

"X* document of particular relevance ; the alaimed invention 
cannot be considered novel or cannot be considered to 
involve an inventive step when the document is taken alone 

*Y* document of particular relevance; the claimed invention 

cannot be considered to invoh/e an inventive step when the 
document is combined with one or more other such docu- 
ments, such combination being obvious to a person skilled 
in the art 

document member of the same patent family 



Date of the actual completion of the international search 



9 December 1997 



Date of mailing of the into motional search report 



o 9. m. 9a 



Name and mailing address of the ISA 

European Patent Office, P.B. 5818 Paten ttaan 2 
NL * 2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 



Authorized officer 



Panzica, G 



Form PCT/ISA/210 (second shoot) (July 1992) 



page 1 of 2 



INTERNATIONAL SEARCH REPORT 



International Application No 

PCT/FR 97/00761 



C(Continuatlon) DOCUMENTS CONSIDERED TO BE RELEVANT 



Category * Citation of document, with indieotion, where appropriate, of the relevant paaaagea 



Relevant to claim No. 



G0DFR0Y A. ET AL.: "Thermococcus 
fumicolans sp. nov.: a new 
hyperthermophilic archaeon isolated from a 
deep-sea hydrothermal vent in the north 
Fiji basin" 

INTERNATIONAL JOURNAL OF SYSTEMATIC 
BACTERIOLOGY, 

vol. 46, no. 4, October 1996, WASHINGTON 
US, 

pages 1113-1119, XP002049496 
cited in the application 
see the whole document 

EP 0 701 000 A (NEW ENGLAND BI0LABS INC) 
13 March 1996 

see page 11, line 20 - page 13, line 54 

PATENT ABSTRACTS OF JAPAN 

vol. 096, no. 007, 31 July 1996 

& JP 08 070864 A (T0Y0B0 CO LTD), 19 

March 1996, 

see abstract 

HODGES R. A. ET AL: "PROTEIN SPLICING 
REMOVES INTERVENING SEQUENCES IN AN 
ARCHAEA DNA POLYMERASE" 
NUCLEIC ACIDS RESEARCH, 
vol. 20, no. 23, 1992, 
pages 6153-6157, XP002033279 
cited in the application 
see the whole document 

PERLER F. B. ET AL: "INTERVENING 
SEQUENCES IN AN ARCHAEA DNA POLYMERASE 
GENE" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 

SCIENCES OF USA, 

vol. 89, June 1992, 

pages 5577"-5581, XPO02033280 

EP 0 602 899 A (NEW ENGLAND BIO LABS INC) 
22 June 1994 
see abstract 

see page 4, line 40 - page 5, line 44 



1-10 



1-10 



II 



11 



11 



11 



Form PCT/tSA/210 (continuation of second «hoet) (July 1992) 



page 2 of 2 



INTERNATIONAL SEARCH REPORT 

Information on patent family members 



International Application No 

PCT/FR 97/00761 



Patent document 
cited in search report 



Publication 



Patent family 



Publication 
date 



EP 0701000 A 

EP 0602899 A 



13-03-96 
22-06-94 



JP 8168376 A 



02-07-96 



JP 7070200 A 
CA 2110938 A 



14-03-95 
10-06-94 



Form PCT/ISA/210 (patent family annex) (July 1992) 



• 



RAPPORT DE RECHERCHE INTERNATIONALE 



Dei. -nde Internationale No 

PCT/FR 97/00761 



A. CLASSEMENT DE L'OBJET DE LA DEMANDE 

CIB 6 C12N9/12 //C12N15/54 



Solon la classification inte matron ate daa brevets (CIB) ou a la fors seion la classification nationals et la CIB 
B. DOMAINES SUR LESQUEL3 LA RECHERCHE A PORTE 



Documentation minimafe oonsuitee (systeme de classification suivi dea 

CIB 6 C12N 



symfaolea de aiassement) 



Documentation oonsuitee autre que ta documentation minimate dans (a 



meaure od oes documents relevant dea domaines sur lesquels a porta la recherche 



Base de donnees eleotronique oonsuitee au oouns de la recherche internationate (nom de la base de donnees, et si oela est realisable, termes de recherche 
utilises) 



C. DOCUMENTS CONSIDERES COMME PERTINENTS 



Categorie 0 Identification dea documents cites, aveo, (e oaa echeant, ('indication dea passages pertinents 



no. dea revendicationa vtseea 



PIETROKOVSKI S: "A new intein in 

cyanobacteria and its significance for the 

spread of inteins" 

TRENDS IN GENETICS, 

vol. 12, no. 8, aout 1996, 

page 287-288 XP004037128 

voir le document en entier 



-/• 



11 



X I Voir la su ite du cadre C pour la fin de la Hate dea documents 



m 



Lea documents de families de brevets sont indiquea en annexe 



0 Categories apeotalee de documents cites: 

*A* document definiaaant Tetat general de la technique, nan 
con side re oomme partiaulierernent pertinent 

*E* document anterieur, mars publie a la date de depot international 
ou apres oette date 

V document pouvant jeter un doute sur une revindication de 
priorite ou oite pour determiner la date de publication d'une 
autre citation ou pour une /arson speciale (telle qu'indiquee) 

"O* document se referent a une divulgation oraie, a un usage, a 
une exposition ou tous autras moyerrs 

"P* document publie avant la date de depdt international, mais 
posteriaurement a la date de priorite revendiquee 



T* document ulterieur publie apres la date de depot international ou la 
date de priorite et n'appartenenant paa a fetal de la 
technique pertinent, mais cite pour oomprendre le princtpe 
ou ia theorie constituent la base de I* invention 

*X" document parti cu lie re ment pertinent; Hnvention revendiquee ne peut 
etre oonaideree oomme nouvelle ou oomme impliquant une aotivite 
inventive par rapport au document considers iaoiement 

*Y" document parti cu lie re ment pertinent; I'invention revendiquee 

ne peut etre oonaideree oomme impliquant une aotivite inventive 
lorsque le document est assocte a un ou plustsurs autres 
documents de memo nature, oette combinaison etant evkfente 
pour une personne du metier 

*&" document qui fait partie de la memo f amide de brevets 



Date a taqueUe (a recherche Internationale a ete effective ment achevee 



9 decembre 1997 



Date ©"expedition du present rapport de recherche Internationale 



0 9. 01 98 



Nom et adresse postale de f administration chargee de la recherche Internationale 
Office European dea Brevets, P.B. 5818 Patentiaan 2 
NL-2280 HV Rijswijk 
Tel. (+31-70) 340-2040, Tx. 31 651 epo nl, 
Fax: (+31-70) 340-3016 



Fonctionnaire auto rise 



Panzica, G 



Formulaire PCT/ISA/210 (deuuimo feuille) (juillet 1992) 



page 1 de 2 



RAPPORT DE RECHERCHE INTERNATIONALE 



Deminde Internationale No 

PCT/FR 97/00761 



C(sulte) DOCUMENTS CONSIDERES COMME PERTINENTS 



Caiegorte ° Identification des documents, cites* avec,te caa echeant, T Indication dea passages, pertinents 



no. des raven di cations vaeee 



G0DFR0Y A. ET AL. : "Thermococcus 
fumicolans sp. nov.: a new 
hyperthermophilic archaeon isolated from a 
deep-sea hydrothermal vent in the north 
Fiji basin" 

INTERNATIONAL JOURNAL OF SYSTEMATIC 
BACTERIOLOGY, 

vol. 46, no. 4, octobre 1996, WASHINGTON 
US, 

pages 1113-1119, XP002049496 
cite dans la demande 
voir le document en entier 

EP 0 701 000 A (NEW ENGLAND BIOLABS INC) 
13 mars 1996 

voir page 11, ligne 20 - page 13, ligne 54 

PATENT ABSTRACTS OF JAPAN 

vol. 096, no. 007, 31 juillet 1996 

& JP 08 070864 A (T0Y0B0 CO LTD), 19 mars 

1996, 

voir abrege 

HODGES R. A. ET AL: "PROTEIN SPLICING 
REMOVES INTERVENING SEQUENCES IN AN 
ARCHAEA DNA POLYMERASE" 
NUCLEIC ACIDS RESEARCH, 
vol. 20, no. 23, 1992, 
pages 6153-6157, XP002033279 
cite dans la demande 
voir le document en entier 

PERLER F. B. ET AL: "INTERVENING 
SEQUENCES IN AN ARCHAEA DNA POLYMERASE 
GENE" 

PROCEEDINGS OF THE NATIONAL ACADEMY OF 

SCIENCES OF USA, 

vol. 89, juin 1992, 

pages 5577-5581, XP002033280 

EP 0 602 899 A (NEW ENGLAND BIOLABS INC) 
22 juin 1994 
voir abrege 

voir page 4, ligne 40 - page 5, ligne 44 



1-10 



1-10 



11 



11 



11 



11 



Formulae* PCT/lSA/210 (suits do la deuxieme feutfle) (juillet 1992) 



page 2 de 2 



* 



RAPPORT DE RECHERCHE INTERNATIONALE 

Renseignements relatlfs aux mem b res de lamiiles da brevets 



Demande Internationale No 

PCT/FR 97/00761 



Document brevet cite 
au rapport de recherche 



Datede 
publication. 



Membre(8) de la 
fam ilia de brevet(s) 



Datede 
publication 



EP O7O1000 A 
EP 0602899 A 



13-03-96 
22-06-94 



JP 8168376 A 



02-07-96 



JP 
CA 



7070200 A 
2110938 A 



14-03-95 
10-06-94 



Formulate PCT/13A/210 {annexe families de brevets) {juillet 1992) 



